📜  r 混淆矩阵 - R 编程语言(1)

📅  最后修改于: 2023-12-03 15:34:35.901000             🧑  作者: Mango

R语言中的混淆矩阵

混淆矩阵是机器学习和数据挖掘中常用的评估模型预测准确性的方法。在R语言中,可以使用confusionMatrix()函数来计算混淆矩阵并绘制相关的分类效果图表。

使用方法

confusionMatrix()函数的基本用法如下:

confusionMatrix(data = NULL, reference = NULL, 
                prediction = NULL, ...) 

其中,data参数是可以包含参考值和预测值的数据框或向量;reference参数是真实的类别标签向量;prediction参数是模型的预测结果向量。在执行时,confusionMatrix()将计算混淆矩阵并返回一些相关的统计信息和可视化图表。

示例代码

下面是一个简单的示例代码,展示了如何使用confusionMatrix()函数计算混淆矩阵和可视化图表:

# 导入相关的库
library(caret)

# 准备数据
set.seed(123)
data(iris)
trainIndex <- createDataPartition(iris$Species, 
                                   p = 0.8, 
                                   list = FALSE)
train <- iris[trainIndex, ]
test <- iris[-trainIndex, ]

# 建立模型
model <- train(Species ~ ., data = train,
               method = "rf")

# 预测测试数据
predictions <- predict(model, newdata = test)

# 计算混淆矩阵并绘制图表
cm <- confusionMatrix(predictions, test$Species)
print(cm$table)
print(cm$overall)
print(cm$byClass)
print(cm$byClass["Balanced Accuracy"])

# 也可以使用plot()函数绘制图表
plot(cm$table, col = cm$byClass["Balanced Accuracy"])

上面的示例代码首先使用类似于k折交叉验证的方法将数据集拆分为训练集和测试集,然后使用随机森林算法训练一个分类模型。在预测测试集数据后,使用confusionMatrix()函数计算混淆矩阵,并绘制了一些分类效果图表。

结论

混淆矩阵是评估分类模型预测效果的重要工具。在R语言中,可以使用confusionMatrix()函数来计算混淆矩阵并绘制相关的分类效果图表。建议在日常开发和研究中,加强混淆矩阵的应用,提高模型预测效果的准确度和稳定性。