📜  熊猫头尾样本的区别

📅  最后修改于: 2022-05-13 01:55:14.874000             🧑  作者: Mango

熊猫头尾样本的区别

先决条件:对 Pandas 的基本了解

在本文中,我们将看到使用Python的 Pandas Head、Tail 和 Sample 之间的区别

Pandas 是一个开源库,主要用于轻松直观地处理关系或标记数据。它提供了用于操作数值数据和时间序列的各种数据结构和操作。读取 CSV 文件后的第一行代码是显示给定数据集的数据。 Pandas 提供了三个这样的功能,您可以通过它们显示示例数据集。三个这样的方法是 Head、Tail 和 Sample。

头部、尾部和样本之间的差异

必须分析他们应该如何显示给定的数据。通常,许多程序员更喜欢选择 head() 并检查起始行来分析数据。但有时可能还不够。我说使用所有三个来分析数据。

样本

使用 Sample 方法,您可以显示数据集中的随机数据。您可以通过不同的方式显示数据集中的样本数据。

例子:

Python
import pandas as pd
  
data = {
    "Anime": ["One Piece", "Naruto", "Bleach",
              "Hunter X Hunter", "Attack On Titan",
              "Gintama", "Code Geass", "Death Note",
              "Black Lagoon", "Classroom Of Elite",
              "Cowboy Bepop", "Jujutsu Kaisen",
              "Blue Period"],
    "Episodes": [1009, 720, 366, 148, 74, 366,
                 50, 37, 24, 12, 26, 24, 12],
    "Year": [1999, 2002, 2004, 2011, 2013, 2006,
             2007, 2008, 2006, 2016, 1995,
             2020, 2021]
}
df = pd.DataFrame(data)


Python3
print(df.sample())  # just one row
print(df.sample(6))  # randomly selected 6 row


Python3
print(df.head())  # default:5 rows
print(df.head(8))  # first 8 ordered rows


Python3
print(df.tail())  # default:5 rows
print(df.tail(8))  # last 8 ordered rows


现在我们有了数据,尝试使用示例方法查看数据。

Syntax: 
df.sample() #returns only one row 
df.sample(n) #returns n number of row 

Python3

print(df.sample())  # just one row
print(df.sample(6))  # randomly selected 6 row

输出:

请注意,样本返回无序的随机数据。

作为简单的英文意思,Head 用于表示身体的上半部分。在 Pandas 中,head 用于从顶部显示有序数据。在传递空参数时,默认情况下,它显示前 5 行。通过提供“n”值,您甚至可以显示 n 个数据。

Syntax: 
df.head() #default=5 Rows 
df.head(n) #n number of rows  

Python3

print(df.head())  # default:5 rows
print(df.head(8))  # first 8 ordered rows

输出:

尾巴

尾巴与头部相对。它从下面显示有序数据。

Syntax: 
df.tail() #default 5 number of rows 
df.tail(n) #n number of rows

Python3

print(df.tail())  # default:5 rows
print(df.tail(8))  # last 8 ordered rows

输出:

结论

样本、头部和尾部之间的主要区别在于:在传递空参数时,样本只返回一行,而头部和尾部返回 5 行。样本返回无序数据,而头部和尾部返回有序数据。