📌  相关文章
📜  pandas read_csv 随机行 - Python (1)

📅  最后修改于: 2023-12-03 15:03:28.474000             🧑  作者: Mango

Pandas Read CSV 随机行

当我们在使用 Pandas 读取 CSV 文件的时候,有时候我们需要随机选择其中的某些行,或者我们需要在遍历整个 CSV 文件之前先取出一定数量的随机行,这时候该怎么做呢?下面是一些方法和代码片段供参考。

方法 1: 使用sample函数
import pandas as pd

# 读取 CSV 文件,sep 表示该文件中各元素之间的分隔符(如逗号、制表符等)
df = pd.read_csv('your_file.csv', sep=',')

# 使用 sample 函数获取随机行,参数 n 表示取出的行数
random_sample = df.sample(n=10)

# 打印输出获取的随机行
print(random_sample)

通过使用 Pandas 中的 sample 函数,我们可以方便地从 CSV 文件中获取指定数量的随机行。其中,n 参数确定了获取的随机行数。

方法 2: 使用 random 和 skiprows 函数
import pandas as pd
import random

# 读取 CSV 文件,sep 表示该文件中各元素之间的分隔符(如逗号、制表符等)
df = pd.read_csv('your_file.csv', sep=',')

# 随机生成需要跳过的行数
skiprows = sorted(random.sample(range(1, len(df)), len(df)-10))

# 使用 skiprows 函数跳过随机行,获取剩余行数的 DataFrame
random_sample = pd.read_csv('your_file.csv', skiprows=skiprows)

# 打印输出获取的随机行
print(random_sample)

通过使用 Python 中的 random 函数,我们可以随机生成需要跳过的行数,然后使用 Pandas 中的 skiprows 函数来跳过这些行数。这样可以得到一个较小的新的 DataFrame,起到了随机行的效果。

总结

以上是两种 Pandas 处理 CSV 文件中的随机行的方法,可以根据具体情况选择适合自己的方法。对于一些特殊的数据集,可能需要自己编写函数来实现随机行的处理。