📜  如何将 R 中的抖动函数用于散点图?

📅  最后修改于: 2022-05-13 01:55:47.932000             🧑  作者: Mango

如何将 R 中的抖动函数用于散点图?

在本文中,我们将讨论如何将 R 编程语言中的 jitter函数用于散点图。

散点图是一个可视化图,它使用笛卡尔坐标来显示一组数据的典型两个变量的值,方法是将它们放在 x 轴和 y 轴上。这对于理解变量之间的关系和找出数据趋势非常有帮助。但是,如果我们将一个连续变量与另一个几乎连续的变量之间的关系可视化,则散点图无法提供良好的可视化效果,因为点被限制在组中并且无法区分。

示例中使用的 CSV 文件可以从这里下载。

示例:散点图

R
# load data frame
df <- read.csv("Sample_data.CSV")
 
# plot scatter plot
plot( df$var1, df$var2, col = 'green')


R
# load data frame
df <- read.csv("Sample_data.CSV")
 
# add noise to dataframe using jitter
# function
df$var1 <- jitter(df$var1, 2)
 
# plot scatter plot
plot( df$var1, df$var2, col = 'green')


R
# load data frame
df <- read.csv("Sample_data.CSV")
 
# add noise to dataframe using jitter
# function
df$var1 <- jitter(df$var1, 20)
 
# plot scatter plot
plot( df$var1, df$var2, col = 'green')


输出:

由于此处 y 轴上的数据也几乎是连续的,因此很难可视化分组数据中的趋势。对于这种情况,我们使用抖动函数。 jitter()函数用于向数值向量添加噪声。 jitter()函数接受一个数字向量和要添加的噪声量,并返回一个长度相同但添加了一定量噪声的数字向量以打破平局。

示例:带有抖动函数的散点图。

R

# load data frame
df <- read.csv("Sample_data.CSV")
 
# add noise to dataframe using jitter
# function
df$var1 <- jitter(df$var1, 2)
 
# plot scatter plot
plot( df$var1, df$var2, col = 'green')

输出:

添加到数据框中的噪声量在可视化中也起着非常重要的作用。如果我们向数据集添加大量噪声,则会影响数据集本身的完整性。使用 jitter()函数添加噪声仅用于可视化目的。否则添加噪声会影响统计计算并使数据集不可靠。

示例:在此示例中,我们添加了非常大量的噪声,因此它使绘图非常随机且无用

R

# load data frame
df <- read.csv("Sample_data.CSV")
 
# add noise to dataframe using jitter
# function
df$var1 <- jitter(df$var1, 20)
 
# plot scatter plot
plot( df$var1, df$var2, col = 'green')


输出: