📜  数据框在多列中 - Python (1)

📅  最后修改于: 2023-12-03 15:26:08.526000             🧑  作者: Mango

数据框在多列中 - Python

在Python中,我们可以使用pandas库创建和处理数据框。在数据框中,我们通常会处理多列的数据。本文将介绍如何在Python中使用数据框在多列中进行数据处理。

创建数据框

首先,我们需要在Python中创建一个数据框。这可以通过pandas库中的DataFrame()函数来实现。下面的代码创建了一个名为“df”的数据框,其中包含三列数据,分别为“name”,“age”和“gender”。

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie', 'David'], 
        'age': [25, 35, 20, 30], 
        'gender': ['F', 'M', 'M', 'M']}

df = pd.DataFrame(data)
选择多列数据

要在数据框中选择多列数据,我们可以使用以下两种方法:

方法一:使用loc[]函数

可以使用loc[]函数选择多列数据,并将它们存储在一个新的数据框中。下面的代码选择了“name”和“age”列,并将它们存储在名为“new_df”的数据框中。

new_df = df.loc[:, ['name', 'age']]
方法二:使用iloc[]函数

另一种选择多列数据的方法是使用iloc[]函数。iloc[]函数基于列的位置选择数据。下面的代码选择了第一个和第二个列,并将它们存储在名为“new_df”的数据框中。

new_df = df.iloc[:, [0, 1]]
对多列数据进行操作

我们可以使用上述两种方法中的任何一种来选择多列数据,并对它们进行各种操作。例如,我们可以计算多列数据的平均值,使用下面的代码:

mean_age = df[['age', 'gender']].groupby('gender').mean()

这个代码选择了“age”和“gender”列,并对它们进行了分组操作。在这个例子中,我们对“gender”列的值进行了分组,并计算了每个组的平均值。

总结

本文介绍了如何在Python中使用数据框在多列中进行数据处理。我们学习了如何创建数据框,并使用loc[]和iloc[]函数选择多列数据。此外,我们还了解了如何对多列数据执行各种操作。