📜  遍历 Pandas DataFrame 中的行和列(1)

📅  最后修改于: 2023-12-03 15:28:28.407000             🧑  作者: Mango

遍历 Pandas DataFrame 中的行和列

Pandas 是一个开源、易于使用的数据分析工具,它可以方便地处理不同类型和大小的数据。在 Pandas 中,可以使用不同的方式遍历 DataFrame 中的行和列,本文将介绍一些常用的方法。

遍历列
方法一:for 循环遍历列

使用 for 循环遍历列是比较基础和常见的方法,代码如下:

import pandas as pd

df = pd.read_csv('file.csv')
for col in df:
    print(col)

其中,df 是读取的 DataFrame 对象,col 代表每一列的名字。

方法二:使用 DataFrame.columns 属性遍历列

另外一种方式是使用 DataFrame.columns 属性获取每一列的名字,如下所示:

import pandas as pd

df = pd.read_csv('file.csv')
for col in df.columns:
    print(col)
遍历行
方法一:for 循环遍历行

使用 for 循环遍历行比较简单,只需要循环 DataFrame 中的行索引即可,代码如下:

import pandas as pd

df = pd.read_csv('file.csv')
for index in df.index:
    print(df.loc[index])

其中,index 代表 DataFrame 中每一行的索引,df.loc[index] 可以获取到每一行的数据。

方法二:使用 iterrows() 方法遍历行

另外一种方式是使用 iterrows() 方法,它可以将 DataFrame 中的每一行转化为元组并返回,方法如下:

import pandas as pd

df = pd.read_csv('file.csv')
for index, row in df.iterrows():
    print(index, row)

其中,index 代表行索引,row 代表行数据,可以通过 row['column'] 获取指定列的值。

遍历行和列

如果需要同时遍历行和列,则可以使用 df.iterrows() 加上 for 循环嵌套的方式,示例如下:

import pandas as pd

df = pd.read_csv('file.csv')
for index, row in df.iterrows():
    for col in df.columns:
        print(index, col, row[col])

其中,index 代表行索引,col 代表列名,row[col] 可以获取每个元素的值。

以上就是遍历 Pandas DataFrame 中的行和列的介绍,根据实际需求选择合适的方式遍历即可。