📜  Python|熊猫索引.get_duplicates()

📅  最后修改于: 2022-05-13 01:55:11.212000             🧑  作者: Mango

Python|熊猫索引.get_duplicates()

Python是一种用于进行数据分析的出色语言,主要是因为以数据为中心的Python包的奇妙生态系统。 Pandas就是其中之一,它使导入和分析数据变得更加容易。

Pandas Index.get_duplicates()函数提取重复的索引元素。此函数返回在索引中出现多次的索引元素的排序列表。

示例 #1:使用Index.get_duplicates()函数查找索引中的所有重复值。

# importing pandas as pd
import pandas as pd
  
# Creating the Index
idx = pd.Index(['Labrador', 'Beagle', 'Labrador',
                    'Lhasa', 'Husky', 'Beagle'])
  
# Print the Index
idx

输出 :

让我们找出索引中的所有重复值。

# print the duplicated values.
idx.get_duplicates()

输出 :

正如我们在输出中看到的, Index.get_duplicates()函数返回了在索引中出现多次的所有值。示例 #2:使用Index.get_duplicates()函数查找索引中的所有重复项。该索引还包含NaN值。

# importing pandas as pd
import pandas as pd
  
# Creating the Index
idx = pd.Index(['Labrador', 'Beagle', None, 'Labrador',
             'Lhasa', 'Husky', 'Beagle', None, 'Koala'])
  
# Print the Index
idx

输出 :

正如我们在输出中看到的,我们有一些缺失值。让我们看看Index.get_duplicates()函数如何处理它们。

# print the duplicate values in Index
idx.get_duplicates()

输出 :

多次出现缺失值被视为重复。