📜  数据框在熊猫问题中描述 - Python (1)

📅  最后修改于: 2023-12-03 15:10:19.144000             🧑  作者: Mango

数据框在熊猫问题中描述 - Python

数据框是 Pandas 库中非常重要的数据结构之一。它是一个二维表格,可以存储不同类型的数据,并且具有行和列的标签。

创建数据框

在 Python 中可以使用多种方式来创建数据框。最常用的方式是使用字典和列表。

使用字典创建数据框

可以使用字典来创建数据框,其中字典的键是列名,字典的值是列的值。

import pandas as pd

df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'],
                   'age': [25, 30, 35],
                   'city': ['New York', 'Paris', 'London']})
print(df)

输出结果为:

       name  age      city
0     Alice   25  New York
1       Bob   30     Paris
2  Charlie   35    London
使用列表创建数据框

可以使用列表来创建数据框,其中列表的元素也是列表,表示数据框中的每一行。

import pandas as pd

data = [['Alice', 25, 'New York'],
        ['Bob', 30, 'Paris'],
        ['Charlie', 35, 'London']]

df = pd.DataFrame(data, columns=['name', 'age', 'city'])
print(df)

输出结果为:

       name  age      city
0     Alice   25  New York
1       Bob   30     Paris
2  Charlie   35    London
读取数据框

在 Python 中可以使用多种方式来读取数据框。最常用的方式是使用 CSV 文件和 Excel 文件。

读取 CSV 文件

可以使用 Pandas 库中的 read_csv 函数来读取 CSV 文件。

import pandas as pd

df = pd.read_csv('data.csv')
print(df)
读取 Excel 文件

可以使用 Pandas 库中的 read_excel 函数来读取 Excel 文件。

import pandas as pd

df = pd.read_excel('data.xlsx')
print(df)
修改数据框

可以使用多种方式来修改数据框。最常用的方式是修改数据框中的某一列或某一行。

修改某一列

可以使用下标或列名来修改某一列的值。

import pandas as pd

df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'],
                   'age': [25, 30, 35],
                   'city': ['New York', 'Paris', 'London']})

# 修改某一列的值
df['age'] = [26, 31, 36]
print(df)

# 使用下标修改某一列的值
df.iloc[:, 1] = [27, 32, 37]
print(df)
修改某一行

可以使用下标或行标签来修改某一行的值。

import pandas as pd

df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'],
                   'age': [25, 30, 35],
                   'city': ['New York', 'Paris', 'London']})

# 修改某一行的值
df.loc[0] = ['Alex', 26, 'Chicago']
print(df)

# 使用下标修改某一行的值
df.iloc[1] = ['Betty', 31, 'Berlin']
print(df)
删除数据框

可以使用多种方式来删除数据框中的某一列或某一行。

删除某一列

可以使用下标或列名来删除某一列。

import pandas as pd

df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'],
                   'age': [25, 30, 35],
                   'city': ['New York', 'Paris', 'London']})

# 删除某一列
df = df.drop('age', axis=1)
print(df)

# 使用下标删除某一列
df = df.drop(df.columns[0], axis=1)
print(df)
删除某一行

可以使用下标或行标签来删除某一行。

import pandas as pd

df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'],
                   'age': [25, 30, 35],
                   'city': ['New York', 'Paris', 'London']})

# 删除某一行
df = df.drop(0)
print(df)

# 使用行标签删除某一行
df = df.drop(1, axis=0)
print(df)
总结

数据框是 Pandas 库中非常重要的数据结构之一。它是一个二维表格,可以存储不同类型的数据,并且具有行和列的标签。在 Python 中可以使用多种方式来创建、读取、修改和删除数据框,使得数据分析变得更加简单和高效。