📜  列表中的 python pandas - Python (1)

📅  最后修改于: 2023-12-03 15:36:51.836000             🧑  作者: Mango

列表中的 Python pandas - Python

简介

Pandas 是 Python 语言用于数据操作和数据分析的一种开源工具。它是基于 NumPy 库的,旨在提供一种灵活而高效的数据结构,使数据处理变得更加简单方便。

Pandas 的主要数据结构是 Series 和 DataFrame。Series 是一种一维数组,它可以保存任何数据类型,包括整数、字符串、浮点数、Python 对象等。DataFrame 是一个二维数组,可以存储不同类型的数据,包括字典、列表、元素、Series 等。

安装

使用 pip 命令安装 pandas:

pip install pandas
使用示例
导入 pandas
import pandas as pd
创建 Series
s = pd.Series([1, 3, 5, np.nan, 6, 8])
创建 DataFrame
dates = pd.date_range('20210101', periods=6)
df = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list('ABCD'))
查看数据
df.head()

输出结果:

|日期 | A | B | C | D | |----|---|---|---|---| |2021-01-01 |-1.730038 | 2.134980 | 0.609732 | 1.813120 | |2021-01-02 |-0.620912 |-0.822504 | 0.643433 | -0.029012 | |2021-01-03 |-1.426375 |-0.210394 | 1.380008 | 1.426637 | |2021-01-04 |-0.792762 | 2.056787 | 0.416307 | 0.423119 | |2021-01-05 |-0.437236 |-0.361647 |-0.850694 | -0.112881 |

描述性统计
df.describe()

输出结果:

| | A | B | C | D | |---|---|---|---|---| |count |6.000000 |6.000000 |6.000000 |6.000000 | |mean |-0.994756 |0.521631 |0.207178 |0.710610 | |std |0.555718 |1.396178 |0.875688 |1.009036 | |min |-1.730038 |-0.822504 |-0.850694 |-0.823182 | |25% |-1.364843 |-0.331346 |-0.184785 |-0.002032 | |50% |-0.706337 | 0.461293 | 0.528379 | 0.673880 | |75% |-0.564021 | 1.927532 | 0.617893 | 1.314020 | |max |-0.437236 | 2.134980 | 1.380008 | 1.813120 |

总结

Pandas 提供了灵活而高效的数据结构,方便了 Python 程序员进行数据操作和数据分析。在数据科学和机器学习领域,Pandas 已成为一种必不可少的工具。