📅  最后修改于: 2023-12-03 14:50:14.227000             🧑  作者: Mango
Pandas 是一个功能强大的数据分析工具,它提供了一种灵活且高效的方式来处理和分析数据。在本系列教程中,我们将介绍如何使用 Pandas 创建数据框(DataFrame)。
数据框是 Pandas 中最重要的数据结构之一,它类似于一个二维表格,可以存储和处理具有不同数据类型的数据。数据框由行和列组成,每列可以具有不同的数据类型,如整数、浮点数、字符串等。
要创建一个空的数据框,可以使用 Pandas 的 DataFrame()
函数,并传入一个空的列表或字典。以下是使用列表的示例:
import pandas as pd
df = pd.DataFrame([])
以下是使用字典的示例,其中字典的键是列名称,值是列数据:
import pandas as pd
data = {'col1': [], 'col2': []}
df = pd.DataFrame(data)
要创建一个带有数据的数据框,可以使用 Pandas 的 DataFrame()
函数,并传入一个包含数据的列表、数组或字典。以下是使用列表的示例:
import pandas as pd
data = [['Alice', 25], ['Bob', 30], ['Charlie', 35]]
df = pd.DataFrame(data, columns=['Name', 'Age'])
以下是使用数组的示例:
import pandas as pd
import numpy as np
data = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
df = pd.DataFrame(data, columns=['A', 'B', 'C'])
以下是使用字典的示例,其中字典的键是列名称,值是列表或数组:
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35]}
df = pd.DataFrame(data)
创建数据框后,我们可以对其进行各种操作,如选择、过滤、排序和更新数据等。以下是一些常用的操作方法:
df['column']
或 df.column
。df.loc[row_index]
或 df.iloc[row_index]
。df[df['column'] > value]
。df.sort_values()
方法按列值排序数据框。通过本系列教程,您已经学会了如何创建 Pandas 数据框。数据框是 Pandas 中最常用、最重要的数据结构之一,它为我们提供了处理和分析数据的强大工具。希望这些教程对您有所帮助,并提高您在数据处理方面的能力。