📜  向数据框插入新列 (1)

📅  最后修改于: 2023-12-03 14:50:41.536000             🧑  作者: Mango

向数据框插入新列

在数据分析中,有时需要向已有的数据框中插入新的列。本文将介绍如何使用Python中的pandas库向数据框中插入新列。具体内容分为以下几个部分:

  • 导入必要的库
  • 创建数据框
  • 插入新列
  • 删除新列
导入必要的库

要实现向数据框中插入新列的功能,我们需要导入pandas库。如果尚未安装此库,可以使用以下命令进行安装:

pip install pandas

导入pandas库的代码如下:

import pandas as pd
创建数据框

接下来,我们需要创建一个数据框。本文使用的数据框是一个包含学生姓名、年龄和成绩的数据框:

data = {'姓名': ['小明', '小红', '小张', '小李'],
        '年龄': [18, 19, 20, 21],
        '成绩': [90, 85, 95, 87]}
df = pd.DataFrame(data)

在jupyter notebook中运行以上代码,我们可以得到如下数据框:

| | 姓名 | 年龄 | 成绩 | |:-:|:---:|:---:|:---:| | 0 | 小明 | 18 | 90 | | 1 | 小红 | 19 | 85 | | 2 | 小张 | 20 | 95 | | 3 | 小李 | 21 | 87 |

插入新列

接下来,我们将向数据框中插入一个新的列“班级”,并将所有数据的班级设置为“一班”。新列的插入可以使用以下代码实现:

df['班级'] = '一班'

我们可以通过以下代码查看插入新列后的数据框:

print(df)

输出结果如下:

| | 姓名 | 年龄 | 成绩 | 班级 | |:-:|:---:|:---:|:---:|:---:| | 0 | 小明 | 18 | 90 | 一班 | | 1 | 小红 | 19 | 85 | 一班 | | 2 | 小张 | 20 | 95 | 一班 | | 3 | 小李 | 21 | 87 | 一班 |

另外,我们也可以向新列中插入已有的数据,例如:

df['班级'] = ['一班', '一班', '二班', '二班']

插入后的数据框如下所示:

| | 姓名 | 年龄 | 成绩 | 班级 | |:-:|:---:|:---:|:---:|:---:| | 0 | 小明 | 18 | 90 | 一班 | | 1 | 小红 | 19 | 85 | 一班 | | 2 | 小张 | 20 | 95 | 二班 | | 3 | 小李 | 21 | 87 | 二班 |

删除新列

如果需要删除数据框中的新列,可以使用以下代码实现:

df.drop('班级', axis=1, inplace=True)

其中,drop函数中的axis=1表示按列进行操作,inplace=True表示直接对原数据框进行操作。我们可以通过以下代码查看删除后的数据框:

print(df)

删除后的数据框如下所示:

| | 姓名 | 年龄 | 成绩 | |:-:|:---:|:---:|:---:| | 0 | 小明 | 18 | 90 | | 1 | 小红 | 19 | 85 | | 2 | 小张 | 20 | 95 | | 3 | 小李 | 21 | 87 |

至此,本文介绍了如何向数据框中插入新列以及删除新列的方法,希望读者能够掌握并灵活运用。