K值选择建议
通常选择K=5或K=10。K值越大,评估偏差越小但方差越大,计算成本也越高。对于大数据集,K=5通常足够;对于小数据集,可考虑K=10或留一法。
模型评估的可靠方法
简单的训练集/测试集划分可能导致评估结果不稳定,特别是当数据量较小时。 交叉验证(Cross-Validation)通过多次划分数据,提供更可靠的模型性能评估, 充分利用有限的数据进行训练和验证。
将数据分成K份
轮流用1份做验证
其余K-1份训练
进行K次实验
取K次结果均值
| 策略 | 说明 | 适用场景 |
|---|---|---|
| K-Fold | 数据分成K份,轮流验证 | 通用场景 |
| Stratified K-Fold | 保持各类别比例 | 分类问题(类别不平衡) |
| Leave-One-Out | 每次留1个样本验证 | 数据量极少时 |
| Time Series Split | 按时间顺序划分 | 时间序列数据 |
| Repeated K-Fold | 多次重复K折 | 需要更稳定评估时 |
通常选择K=5或K=10。K值越大,评估偏差越小但方差越大,计算成本也越高。对于大数据集,K=5通常足够;对于小数据集,可考虑K=10或留一法。