📜  创建数据框 python (1)

📅  最后修改于: 2023-12-03 14:50:15.653000             🧑  作者: Mango

创建数据框 Python

在Python中创建数据框是一项非常常见的任务,特别是当我们需要在Python中处理数据时。数据框是一个二维表,它由行和列组成。在Python中,有几个库可以帮助我们创建数据框,例如pandas和numpy等。

创建数据框的方法
使用pandas

Pandas是Python中最受欢迎的数据处理和分析库之一。它提供了大量的数据类型和函数,可以轻松创建、操作和分析数据框。

创建数据框的最基本方法是使用pandas.DataFrame()函数。下面是一个简单的例子,创建一个包含3个列和3个行的数据框:

import pandas as pd

data = {'name': ['Tom', 'Jerry', 'Spike'],
        'age': [12, 16, 9],
        'gender': ['M', 'M', 'F']}

df = pd.DataFrame(data)
print(df)

输出结果:

| | name | age | gender | | -- | -- | -- | -- | | 0 | Tom | 12 | M | | 1 | Jerry | 16 | M | | 2 | Spike | 9 | F |

使用numpy

Numpy是Python中用于数值计算的库。它提供了一种创建数组的基本数据类型,这些数组可以用来处理数值数据和其他类型的数据。

使用numpy创建数据框可以使用numpy.array()函数。下面是一个简单的例子,创建一个包含3个列和3个行的数据框:

import numpy as np

data = np.array([['Tom', 12, 'M'],
                ['Jerry', 16, 'M'],
                ['Spike', 9, 'F']])

df = pd.DataFrame(data, columns=['name', 'age', 'gender'])
print(df)

输出结果:

| | name | age | gender | | -- | -- | -- | -- | | 0 | Tom | 12 | M | | 1 | Jerry | 16 | M | | 2 | Spike | 9 | F |

添加数据

要向数据框中添加数据,我们可以使用pandas.DataFrame.append()函数。下面是一个简单的例子,向上面的数据框中添加一行数据:

new_data = {'name': 'Tuffy', 
            'age': 4, 
            'gender': 'F'}
df = df.append(new_data, ignore_index=True)

print(df)

输出结果:

| | name | age | gender | | -- | -- | -- | -- | | 0 | Tom | 12 | M | | 1 | Jerry | 16 | M | | 2 | Spike | 9 | F | | 3 | Tuffy | 4 | F |

删除数据

要从数据框中删除数据,我们可以使用pandas.DataFrame.drop()函数。下面是一个简单的例子,从数据框中删除一行数据:

df = df.drop([2], axis=0)

print(df)

输出结果:

| | name | age | gender | | -- | -- | -- | -- | | 0 | Tom | 12 | M | | 1 | Jerry | 16 | M | | 3 | Tuffy | 4 | F |

筛选数据

要从数据框中筛选数据,我们可以使用pandas.DataFrame.loc[]函数。下面是一个简单的例子,筛选出年龄大于10岁的数据:

df = df.loc[df['age'] > 10]

print(df)

输出结果:

| | name | age | gender | | -- | -- | -- | -- | | 0 | Tom | 12 | M | | 1 | Jerry | 16 | M |

结论

以上就是在Python中创建数据框的方法。在实践中,pandas通常是创建数据框的首选方法,因为它提供了完整的数据框功能,同时还提供了很多其他有用的数据处理和分析工具。