在 pandas 中读取 txt - Python (1) - 芒果文档

📌 相关文章

📜 在 pandas 中读取 txt - Python (1)

📅 最后修改于: 2023-12-03 15:23:14.786000 🧑 作者: Mango

在 pandas 中读取 txt - Python

在 Python 中，pandas 库是数据分析与处理中非常常见和重要的一个库，它可以快速便捷地对数据进行处理。本篇教程将会介绍如何使用 pandas 库来读取 txt 文件并进行相关操作。

准备工作

在开始之前，需要确保已经安装好了 pandas 库，如果没有安装可以通过以下命令来进行安装：

pip install pandas

然后，需要准备要读取的 txt 文件，这里我们先创建一个名为 test.txt 的文件，并把以下内容写入到文件中：

name age gender
Tom 18 male
Lily 19 female
Jack 20 male

读取 txt 文件

在 pandas 中可以使用 read_table() 函数来读取 txt 文件，这个函数的默认分隔符为制表符（\t），读取上面的 test.txt 文件代码如下：

import pandas as pd

df = pd.read_table('test.txt')
print(df)

输出结果如下：

  name  age  gender
0  Tom   18    male
1 Lily   19  female
2 Jack   20    male

可以看到，我们读取的数据已经被转换成了一个 pandas 的 DataFrame 类型，其中第一行为表头，后面的数据为内容。

文件分隔符

如果我们的 txt 文件使用的分隔符不是 \t 制表符，我们可以通过设置 sep 参数来指定分隔符，比如使用空格作为分隔符：

import pandas as pd

df = pd.read_table('test.txt', sep=' ')
print(df)

指定列名

如果我们的 txt 文件没有表头或者表头需要指定需要读取的列名，我们可以通过 names 参数来指定，比如读取 name 和 age 两列的代码如下：

import pandas as pd

df = pd.read_table('test.txt', sep=' ', names=['name', 'age'])
print(df)

输出结果如下：

   name  age
0   Tom   18
1  Lily   19
2  Jack   20

跳过某些行

如果我们的 txt 文件中有一些无用的行不需要读取，我们可以通过设置 skiprows 参数来跳过这些行，比如跳过第一行的代码如下：

import pandas as pd

df = pd.read_table('test.txt', sep=' ', skiprows=[0])
print(df)

结尾

通过以上的介绍，我们可以看到 pandas 可以方便地读取 txt 文件，而且还可以通过一系列的参数来满足不同的需求。当然，除了 txt 文件，pandas 还可以读取其他的数据格式，比如 csv、excel 等，这些可以在后续的教程中介绍。