📜  Python|熊猫系列.where(1)

📅  最后修改于: 2023-12-03 15:19:22.010000             🧑  作者: Mango

Python熊猫系列之.where()

简介

.where()是Pandas库中的一个函数,主要用于从DataFrame中减少原有数据集中的数据量。这个函数只需要指定一个条件,就可以得到符合条件的数据集。

用法

语法:DataFrame.where(cond, other=nan, inplace=False, axis=None, level=None, errors='raise', try_cast=False)

参数说明:
  • cond:所需筛选数据的条件;
  • other:不符合条件的值将被赋予该值,默认为NaN;
  • inplace:是否直接在原DataFrame中操作;
  • axis:计算的方向,0为行,1为列,默认为无;
  • level:需要筛选的axis在多重索引上用的级别,默认为无;
  • errors:设定出现错误时的处理方式,默认为raise;
  • try_cast:是否进行强制类型转化,如果出现内存溢出,建议设置为False。
示例:
import pandas as pd
import numpy as np

df = pd.DataFrame({'A': [1, 2, 3, 4, 5],
                   'B': [6, 7, 8, 9, 10],
                   'C': ['a', 'b', 'c', 'd', 'e']})

df.where(df > 3, -df)
返回值:
     A    B  C
0 -1.0 -6.0 -a
1 -2.0 -7.0 -b
2 -3.0 -8.0 -c
3  4.0  9.0  d
4  5.0  10.0 e
总结

.where()函数的使用非常简单,可以帮助我们轻松地完成数据筛选的功能。但需要注意的是,由于这个函数只是减少原有数据集中的数据量,因此不能帮我们改变数据类型等问题,所以在使用时需要谨慎。