📜  从字典列表创建 Pandas DataFrame(1)

📅  最后修改于: 2023-12-03 15:21:56.860000             🧑  作者: Mango

从字典列表创建 Pandas DataFrame

Pandas 是 Python 编程语言的一个重要数据分析包,主要用于数据处理和处理。Pandas 的 DataFrame对象是一个类似于二维表格的数据结构。本文将介绍如何使用字典列表创建 Pandas DataFrame。

准备工作

在使用 Pandas 创建 DataFrame 之前,需要先导入 Pandas 模块。一般情况下我们可以使用以下方式导入 Pandas 模块:

import pandas as pd
创建 DataFrame

创建 DataFrame 的方法之一是使用字典列表。在这种情况下,每个字典都表示一个数据记录,每个字典的键表示列名(即数据记录的属性),每个键所对应的值表示一个数据记录的值。例如,我们可以使用以下字典列表创建一个 DataFrame:

# 导入 pandas 模块
import pandas as pd

# 创建一个字典列表
data = [
    {'name': 'alice', 'age': 22},
    {'name': 'bob', 'age': 25},
    {'name': 'charlie', 'age': 30},
    {'name': 'david', 'age': 35},
    {'name': 'eve', 'age': 40}
]

# 使用字典列表创建 DataFrame
df = pd.DataFrame(data)

# 输出 DataFrame
print(df)

输出结果如下:

      name  age
0    alice   22
1      bob   25
2  charlie   30
3    david   35
4      eve   40

在上面的代码中,我们创建了一个字典列表,其中每个字典表示一条数据记录。我们使用了 Pandas 的 DataFrame 函数来创建 DataFrame。在创建 DataFrame 时,我们不必显式指定列名及其顺序,Pandas 会自动生成一个默认的整数索引列。

我们还可以通过指定列名的顺序来创建 DataFrame。例如,我们可以使用以下代码创建一个不同顺序的 DataFrame:

# 导入 pandas 模块
import pandas as pd

# 创建一个字典列表
data = [
    {'age': 22, 'name': 'alice'},
    {'age': 25, 'name': 'bob'},
    {'age': 30, 'name': 'charlie'},
    {'age': 35, 'name': 'david'},
    {'age': 40, 'name': 'eve'}
]

# 指定列名的顺序
cols = ['name', 'age']

# 使用字典列表和列名列表创建 DataFrame
df = pd.DataFrame(data, columns=cols)

# 输出 DataFrame
print(df)

输出结果如下:

      name  age
0    alice   22
1      bob   25
2  charlie   30
3    david   35
4      eve   40

在上面的代码中,我们指定了列名的顺序,再使用 DataFrame 函数创建 DataFrame 时,就按照指定的列名顺序来排列了。

在创建 DataFrame 时,如果某条数据记录中没有某个属性,Pandas 会使用 NaN 值来填充。例如,我们可以使用以下字典列表创建一个 DataFrame:

# 导入 pandas 模块
import pandas as pd

# 创建一个字典列表
data = [
    {'name': 'alice', 'age': 22, 'gender': 'female'},
    {'name': 'bob', 'age': 25},
    {'name': 'charlie', 'gender': 'male'},
    {'age': 35, 'name': 'david'},
    {'name': 'eve'}
]

# 使用字典列表创建 DataFrame
df = pd.DataFrame(data)

# 输出 DataFrame
print(df)

输出结果如下:

      name   age  gender
0    alice  22.0  female
1      bob  25.0     NaN
2  charlie   NaN    male
3    david  35.0     NaN
4      eve   NaN     NaN

在上面的代码中,我们创建了一个字典列表,其中包含不同数量和顺序的数据记录。在创建 DataFrame 时,Pandas 会按照所有数据记录所具备的属性创建列,如果某些数据记录缺少某个属性,Pandas 会使用 NaN 值来填充。

总结

在本文中,我们介绍了如何使用字典列表创建 Pandas DataFrame。我们首先使用了一个简单的字典列表来创建 DataFrame,然后介绍了如何指定列名和顺序,最后演示了如何处理缺失值。Pandas DataFrame 是非常强大和灵活的数据结构,在数据处理和分析过程中广泛使用。