📅  最后修改于: 2023-12-03 15:41:47.302000             🧑  作者: Mango
在 Python 中,我们可以使用 pandas
模块读取和操作 tsv 文件。下面是一些常用的代码片段,用于读取单个列或多个列。
首先,让我们创建一个示例 tsv 文件,其中包含姓名、年龄和性别列:
姓名 年龄 性别
Amy 24 女
Bob 32 男
Cathy 28 女
Dan 45 男
要读取单个列中的数据,请使用 pandas
中的 read_csv
函数,并指定要读取的列名称。例如,要读取 '年龄' 列中的所有数据,可以使用以下代码:
import pandas as pd
# 读取 tsv 文件
df = pd.read_csv('example.tsv', delimiter='\t')
# 读取单个列数据
age = df['年龄']
# 打印年龄列数据
print(age)
这将输出以下内容:
0 24
1 32
2 28
3 45
Name: 年龄, dtype: int64
请注意,我们需要使用 '\t' 作为分隔符,因为这是一个 tsv 文件。默认情况下,read_csv
函数使用逗号 ',' 作为分隔符。
要读取多个列中的数据,请指定要读取的列名称列表。例如,要读取 '姓名' 和 '性别' 列的数据,可以使用以下代码:
import pandas as pd
# 读取 tsv 文件
df = pd.read_csv('example.tsv', delimiter='\t')
# 读取多个列数据
name_gender = df[['姓名', '性别']]
# 打印姓名和性别列数据
print(name_gender)
这将输出以下内容:
姓名 性别
0 Amy 女
1 Bob 男
2 Cathy 女
3 Dan 男
请注意,我们使用一个包含所需列名称的列表作为索引器,以便从 DataFrame
中选择多列。
这就是 Python 中使用 pandas
读取 tsv 文件列的方式。使用这些方法,您可以轻松地操作和分析大型数据集中的列数据。