📜  Python Pandas数据操作

📅  最后修改于: 2020-10-29 03:02:18             🧑  作者: Mango

Python Pandas数据操作

在Pandas中,DataFrame有多种有用的数据操作,如下所示:

行和列选择

我们可以通过传递行和列的名称来选择DataFrame的任何行和列。当您从DataFrame中选择它时,它将变为一维并被视为Series。

筛选资料

我们可以通过在DataFrame中提供一些布尔表达式来过滤数据。

注意:如果我们要将布尔结果传递给DataFrame,则它将显示所有结果。

空值

当没有数据提供给项目时,可能会出现Null值。各个列可能不包含通常表示为NaN的值。在Pandas 中,有几个有用的功能可用于检测,删除和替换数据框中的空值。这些功能如下:

isnull():isnull()的主要任务是在任何行具有空值的情况下返回真值。

notnull():与isull()函数相反,它返回非空值的真值。

dropna():此方法分析并删除空值的行/列。

fillna():它允许用户将NaN值替换为其他一些值。

replace():这是一个非常丰富的函数,用于替换字符串,正则表达式,系列,字典等。

interpolate():这是一个非常强大的函数,可填充DataFrame或系列中的空值。

字符串运算

Pandas 提供了一组字符串函数,可对字符串数据进行操作,并忽略丢失/ NaN值。使用.str可以执行不同的字符串操作。选项。这些功能如下:

lower():它将系列或索引的任何字符串转换为小写字母。

upper():它将系列或索引的任何字符串转换为大写字母。

strip():此函数有助于从Series / index中的每个字符串中剥离包含新行的空格。

split(”):这是一个使用给定模式分割字符串的函数。

cat(sep =”):使用给定的分隔符连接系列/索引元素。

contains(pattern):如果元素中存在子字符串,则返回True,否则返回False。

replace(a,b):将值a替换为值b。

repeat(value):将每个元素重复指定的次数。

count(pattern):它返回每个元素中图案外观的计数。

startswith(pattern):如果系列中的所有元素均以模式开头,则返回True。

endswith(pattern):如果系列中的所有元素都以模式结尾,则返回True。

find(pattern):用于返回模式的第一个匹配项。

findall(pattern):返回所有出现的模式的列表。

swapcase:用于交换大小写的大小写。

islower():如果“系列/索引”字符串中的所有字符均为小写,则返回True。否则,它返回False。

isupper():如果“系列/索引”字符串中的所有字符均为大写,则返回True。否则,它返回False。

isnumeric():如果“系列/索引”字符串中的所有字符均为数字,则返回True。否则,它返回False。

计数值

此操作用于使用’value_counts()’选项对出现的总数进行计数。

情节

Pandas 使用matplotlib库绘制图形。 .plot()方法允许您绘制数据图。

.plot()函数针对每一列绘制索引。

您也可以将参数传递给plot()函数以绘制特定的列。