如何在 R 中对模型性能执行交叉验证

k-fold 交叉验证方法的工作原理如下：

1.将数据随机分成 k 个“折叠”或子集（例如 5 或 10 个子集）。
2.在所有数据上训练模型，只留下一个子集。
3.使用模型对遗漏的子集中的数据进行预测。
4.重复这个过程，直到 k 个子集的每一个都被用作测试集。
5 . 通过计算 k 个测试误差的平均值来衡量模型的质量。这被称为
交叉验证错误。

在这个例子中，我们首先将数据分成 5 个子集。然后，我们使用除一个子集以外的所有数据拟合模型。接下来，我们使用该模型对遗漏的子集进行预测并记录测试误差（使用 R 平方、RMSE 和 MAE）。我们重复这个过程，直到每个子集都被用作测试集。然后我们简单地计算 5 个测试错误的平均值。

#load dplyr library used for data manipulation
library(dplyr)

#load caret library used for partitioning data into training and test set
library(caret)

#make this example reproducible
set.seed(1
2
3
4
5
6
7

相关阅读:
udp通信socket关闭后，缓存不清空
自定义模块和第三方模块，cnmp
JavaSE - 继承
大数据开发的前景和就业如何？该如何去学习它？
centos7搭建EFK日志收集系统
【面试题】AQS
人社部公布“数据库运行管理员”成新职业，OceanBase参与制定职业标准
2 分钟，教你用 Serverless 每天给女朋友自动发土味情话
107. 如何使用Docker以及Docker Compose部署Go Web应用
Socket编程实现简易聊天室

原文地址：https://blog.csdn.net/Mrrunsen/article/details/125420467