📜  来自组 pandas 的 dict - Python (1)

📅  最后修改于: 2023-12-03 15:26:34.870000             🧑  作者: Mango

来自组 pandas 的 dict - Python

简介

pandas 是 Python 中的一个开源数据分析和数据处理库。pandas 中有一个很常用的数据结构叫做 DataFrame,它类似于其他语言中的表格或者电子表格。在 DataFrame 中,每一列数据可以是不同的类型(str、int、float 等),并且可以进行各种复杂的操作。

在 pandas 中,可以通过从一个 dict 创建 DataFrame 来实现数据的处理和分析。下面我们来一步步介绍如何使用来自组 pandas 的 dict。

创建 dict

我们可以通过直接创建一个字典来创建 DataFrame。例如:

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie', 'David'], 'age': [25, 30, 35, 40]}
df = pd.DataFrame(data)
print(df)

输出结果为:

       name  age
0     Alice   25
1       Bob   30
2   Charlie   35
3     David   40

在这个字典中,'name' 和 'age' 是数据列的名称。可以发现,pandas 已经自动按照列名和行号进行了格式化。

创建带有索引的 dict

如果我们想要进一步设置行名,可以在生成 DataFrame 时设置 'index' 参数:

data = {'name': ['Alice', 'Bob', 'Charlie', 'David'], 'age': [25, 30, 35, 40]}
df = pd.DataFrame(data, index=['A', 'B', 'C', 'D'])
print(df)

输出结果为:

      name  age
A    Alice   25
B      Bob   30
C  Charlie   35
D    David   40

在这个 DataFrame 中,我们为其添加了行索引,它们分别为 A、B、C 和 D,而不再是默认的数字索引。

访问 dict

访问 DataFrame 中的数据可以使用类似于字典查询的方式,例如:

print(df['name'])

输出结果为:

A      Alice
B        Bob
C    Charlie
D      David
Name: name, dtype: object

如果我们希望访问多列数据,则可以使用多个列名构成的列表,例如:

print(df[['name', 'age']])

输出结果为:

      name  age
A    Alice   25
B      Bob   30
C  Charlie   35
D    David   40
其他操作

除了上述操作之外,pandas 还提供了丰富的数据操作和分析的功能,例如数据类型转换、数据合并、数据过滤等等。这些功能的使用方法可以参考 pandas 文档。

结论

通过使用来自组 pandas 的 dict,我们可以方便地创建、访问和处理 DataFrame 数据,从而完成各种数据分析和处理任务。