📜  如何用 R 制作 PCA 图(1)

📅  最后修改于: 2023-12-03 15:38:51.775000             🧑  作者: Mango

如何用 R 制作 PCA 图

PCA(Principal Component Analysis)主成分分析是一种常见的多维数据分析方法,可用于降维和可视化。本文将介绍如何使用 R 语言制作 PCA 图。

准备数据

首先,我们需要准备一个数据集。这里以鸢尾花数据集为例:

data(iris)
df <- iris[, 1:4]

我们只选取了前四个变量,即花萼长度、花萼宽度、花瓣长度、花瓣宽度。

数据标准化

在进行 PCA 分析之前,需要对数据进行标准化处理,使各变量具有相同的尺度。这可以通过对数据进行均值中心化和标准差缩放来实现。

scaled_df <- scale(df, center = TRUE, scale = TRUE)
计算主成分

接下来,我们使用 prcomp 函数计算主成分。这个函数将返回主成分分析的结果,包括主成分得分、方差解释比例和特征值等信息。

pca <- prcomp(scaled_df)
summary(pca)
绘制 PCA 图

最后,我们可以使用 ggbiplot 包来绘制 PCA 图。ggbiplot 提供了一个简单的方法来可视化 PCA 分析结果。

library(ggbiplot)
ggbiplot(pca, obs.scale = 1, var.scale = 1) + 
  scale_color_discrete(name = '')

这里,我们设置了 obs.scale 和 var.scale 参数为 1,以确保结果在相同的比例下呈现。scale_color_discrete 函数用于将颜色调整为离散值。

完整代码
library(ggbiplot)
data(iris)

df <- iris[, 1:4]
scaled_df <- scale(df, center = TRUE, scale = TRUE)
pca <- prcomp(scaled_df)
summary(pca)

ggbiplot(pca, obs.scale = 1, var.scale = 1) + 
  scale_color_discrete(name = '')

以上就是使用 R 制作 PCA 图的全部过程。感谢阅读!