📜  在 pandas 中读取 txt - Python (1)

📅  最后修改于: 2023-12-03 15:23:14.786000             🧑  作者: Mango

在 pandas 中读取 txt - Python

在 Python 中,pandas 库是数据分析与处理中非常常见和重要的一个库,它可以快速便捷地对数据进行处理。本篇教程将会介绍如何使用 pandas 库来读取 txt 文件并进行相关操作。

准备工作

在开始之前,需要确保已经安装好了 pandas 库,如果没有安装可以通过以下命令来进行安装:

pip install pandas

然后,需要准备要读取的 txt 文件,这里我们先创建一个名为 test.txt 的文件,并把以下内容写入到文件中:

name age gender
Tom 18 male
Lily 19 female
Jack 20 male
读取 txt 文件

在 pandas 中可以使用 read_table() 函数来读取 txt 文件,这个函数的默认分隔符为制表符(\t),读取上面的 test.txt 文件代码如下:

import pandas as pd

df = pd.read_table('test.txt')
print(df)

输出结果如下:

  name  age  gender
0  Tom   18    male
1 Lily   19  female
2 Jack   20    male

可以看到,我们读取的数据已经被转换成了一个 pandas 的 DataFrame 类型,其中第一行为表头,后面的数据为内容。

文件分隔符

如果我们的 txt 文件使用的分隔符不是 \t 制表符,我们可以通过设置 sep 参数来指定分隔符,比如使用空格作为分隔符:

import pandas as pd

df = pd.read_table('test.txt', sep=' ')
print(df)
指定列名

如果我们的 txt 文件没有表头或者表头需要指定需要读取的列名,我们可以通过 names 参数来指定,比如读取 name 和 age 两列的代码如下:

import pandas as pd

df = pd.read_table('test.txt', sep=' ', names=['name', 'age'])
print(df)

输出结果如下:

   name  age
0   Tom   18
1  Lily   19
2  Jack   20
跳过某些行

如果我们的 txt 文件中有一些无用的行不需要读取,我们可以通过设置 skiprows 参数来跳过这些行,比如跳过第一行的代码如下:

import pandas as pd

df = pd.read_table('test.txt', sep=' ', skiprows=[0])
print(df)
结尾

通过以上的介绍,我们可以看到 pandas 可以方便地读取 txt 文件,而且还可以通过一系列的参数来满足不同的需求。当然,除了 txt 文件,pandas 还可以读取其他的数据格式,比如 csv、excel 等,这些可以在后续的教程中介绍。