📜  Python | Pandas数据比较与选择

📅  最后修改于: 2020-04-22 03:03:24             🧑  作者: Mango

Python是进行数据分析的一种出色语言,主要是因为以数据为中心的Python软件包具有奇妙的生态系统。Pandas是其中的一种,使导入和分析数据更加容易。
数据分析中最重要的事情是比较值并相应地选择数据。“ ==”运算符也适用于Pandas数据框中的多个值。以下两个示例将说明如何比较和选择“熊猫数据”框架中的数据。
要下载使用的CSV文件,请单击此处

示例1:比较数据
在以下示例中,从csv文件创建数据帧。在“Gender”列中,只有3种类型的值(“Male”,“Female“或NaN)。将性别列的每一行与“Male”进行比较,然后返回布尔系列。

# 导入pandas
import pandas as pd
# 从csv文件制作数据帧
data = pd.read_csv("employees.csv")
# 将布尔series存储在新的
new = data["Gender"] == "Male"
# 在数据框中插入新series
data["New"]= new
# 打印
data

输出:


如输出图像中所示,对于Gender =“ Male”,新列中的值为True,对于“ Female”和NaN值为False。

示例2:选择数据
在下面的示例中,将布尔序列传递给数据,并且仅返回Gender =“ Male”的行。

# 导入pandas
import pandas as pd
# 从csv文件制作数据帧
data = pd.read_csv("employees.csv")
# 将布尔系列存储在new
new = data["Gender"] != "Female"
# 在数据框中插入新系列
data["New"]= new
# 打印
data[new]
# 或
# data[data["Gender"]=="Male"]
# 上述一样

输出:

如输出图像所示,返回Gender =“ Male”的数据框。

注意:对于NaN值,布尔值是False。