Pandas Series.unique()

📌 相关文章

📜 Pandas Series.unique()

📅 最后修改于: 2020-10-29 01:48:55 🧑 作者: Mango

在Pandas中使用DataFrame时，您需要查找列中存在的唯一元素。为此，我们必须使用unique()方法从列中提取唯一值。 Python的Pandas库可以轻松地帮助我们找到唯一的数据。

列中存在的唯一值按其出现的顺序返回。这不会排序其出现顺序。另外，此方法基于哈希表。

它比numpy.unique()方法快得多，并且还包含空值。

pandas.unique(values)

values：它是指由数组值组成的一维类似于数组的对象。

此方法返回numpy.ndarray或ExtensionArray对象，可以是：

import pandas as pd
pd.unique(pd.Series([2, 1, 3, 3]))
pd.unique(pd.Series([pd.Timestamp('20160101'),
pd.Timestamp('20160101')]))

输出：

array(['2016-01-01T00:00:00.000000000'], dtype='datetime64[ns]')

示例2：下面的示例从Index中提取唯一的时间戳：

import pandas as pd
import numpy as np
pd.unique(pd.Index([pd.Timestamp('20160101', tz='US/Eastern'),
pd.Timestamp('20160101', tz='US/Eastern')]))

输出：

DatetimeIndex(['2016-01-01 00:00:00-05:00'], dtype='datetime64[ns, US/Eastern]', freq=None)