📜  Python | Pandas 数据 DataFrame

📅  最后修改于: 2020-04-19 14:34:10             🧑  作者: Mango

Pandas DataFrame是带有标签轴(行和列)的二维大小可变的,可能是异构的表格数据结构。数据框是二维数据结构,即,数据以表格形式在行和列中对齐。Pandas DataFrame由三个主要组件组成,即datarowscolumn


我们将简要介绍可以在Pandas DataFrame上执行的所有这些基本操作:

  • 创建一个DataFrame
  • 处理行和列
  • 索引和选择数据
  • 处理丢失的数据
  • 遍历行和列

创建一个Pandas DataFrame

在现实世界中,将通过从现有存储中加载数据集来创建Pandas DataFrame,存储可以是SQL数据库,CSV文件和Excel文件。可以从列表,元组和字典列表等中创建Pandas DataFrame。可以以不同的方式创建数据框,以下是我们创建数据框的一些方法:
使用List创建数据可以使用单个列表或列表列表创建DataFrame:

import pandas as pd

# 字符串列表
lst = ['Geeks', 'For', 'Geeks', 'is',
       'portal', 'for', 'Geeks']

# Calling DataFrame constructor on list
df = pd.DataFrame(lst)
print(df)
 

输出:



从ndarray / list的dict创建DataFrame:要从narray / list的dict创建DataFrame,所有narray的长度必须相同。如果传递了索引,则索引长度应等于数组的长度。如果没有传递索引,则默认情况下,索引将是range(n),其中n是数组长度。

# Python代码演示从dict narray/列表创建DataFrame
# 默认地址.
import pandas as pd
# 初始化列表数据.
data = {'Name':['Tom', 'nick', 'krish', 'jack'],
        'Age':[20, 21, 19, 18]}
# 创建数据框
df = pd.DataFrame(data)
# Print the output.
print(df)
输出: