📜  如何在 Excel 中查找异常值?

📅  最后修改于: 2022-05-13 01:56:15.924000             🧑  作者: Mango

如何在 Excel 中查找异常值?

顾名思义,异常值是不在要求/给定范围内的东西。需要删除统计数据中的异常值,因为它们会影响在执行所需计算后做出的决定。异常值通常会使决策产生偏差,即他们将决策朝积极或消极的方向移动。有时通过查看数据很容易找到异常值,但当数据很大时很难找到异常值。我们将借助一个示例来了解这一点,给定一个数据集,您需要对数据集 1、89、57、100、150、139、49、87、200、250 进行平均。因此,给定的数据集是 112.2。但是,可以清楚地看到 1、200 和 250 是太小或太大而不能成为数据集一部分的范围。这些范围被称为数据中的异常值。去除异常值后,平均值变为 95.85。从上面的例子中可以明显看出,异常值会根据情况做出决策。

在 Excel 中使用排序查找异常值

当您的数据不大时,这是在 MS excel 中查找异常值的最简单方法之一,因为通过查看数据,您将了解远离原始记录值的值。

未分类数据

从上图中,我们可以清楚地看出数据没有排序,因此我们需要一些时间来识别异常值。

排序数据

在看图的时候。 2,我们可以清楚地说,数字 1、200 和 250 是异常值。

使用 LARGE/SMALL Excel函数查找异常值

另一种查找异常值的方法是使用内置的 MS Excel 函数,称为 LARGE 和 SMALL。 LARGE函数将返回数据数组中的最大值,而 SMALL函数将返回最小值。在这里,我们将使用 LARGE 和 SMALL函数,它是 Microsoft excel 中的内置函数。考虑上面使用的示例:

大大小小的例子

大函数语法:

在这里,我们传递一个数组和一个数字。该数组具有我们必须为其找到异常值的数据集,数字 1 表示数组中的第一个最大数字。如果我们使用 2,它将返回数组中的第二大值。现在当我们在上面的例子中使用这个函数时,我们将得到以下输出:

大功能输出

小函数语法:

语法和传递值是相同的。现在当我们在上面的例子中使用这个函数时,我们将得到以下输出:

小功能输出

注意:如果数据中有多个异常值,那么您必须一次又一次地使用该函数。

使用四分位间距 (IQR) 查找异常值

上面示例中提供的数据样本量很小,但是当涉及到现实生活中的情况时,数据可能会很大,这就是原始问题出现的地方。根据 IQR,异常值是数据集中位于第一个四分位数 (Q1) 下方 1.5 倍 IQR 和第三个四分位数 (Q3) 上方 1.5 倍 IQR 的任何数据点。

公式是

使用以下步骤查找异常值:

步骤 1:打开存储查找异常值的数据的工作表。

第 2 步:添加函数QUARTILE(array, quart) ,其中数组是要计算四分位数的数据集,夸脱是四分位数。在我们的例子中,夸脱是 1,因为我们希望计算第一个四分位数来计算最低离群值。

四分位数 1

Quart NumberQuartile Returns
0Minimum Value
1First quartile(25th percentile)
2Median Value(50th percentile)
3Third Quartile(75th percentile)
4Maximum Value

第 3 步:与第 2 步类似,在 Q3 下添加四分位数公式并将 3 写为四分位数,因为我们希望计算第 3 个四分位数,即第 75 个百分位数来计算最高四分位数值。

第4步:四分位间距或IQR是Q3-Q1 ,输入公式得到IQR值。

IQR

第 5 步:要找到最高值,公式为Q3+(1.5*IQR) 。同样,对于Low value ,公式为Q1-(1.5*IQR)

高四分位数和低四分位数

Step 6:判断数据集中的数字是否异常,我们需要检查数据条目是高于High值还是低于Low值。为此,我们将使用OR函数。公式为OR(B3>$G$3, B3<$H$3)。将公式放入所需单元格并向下拖动与最后一个数据集相邻的单元格,如果值返回TRUE ,则数据为异常值,否则不是。

检查数据集中的数字是否是异常值

由于您已经检查了异常数据。现在您可以删除异常值并使用其余数据进行计算并获得无偏的结果。