机器学习基石笔记：15 Validation

一、模型选择

图1.1 模型选择问题

如何选择?

图1.2 泛化的保证

折中：将样本资料分为两部分。一部分用作训练，一部分用作验证。

图1.3 样本内误差和测试误差的比较

图2.1 验证集

基于验证集的模型选择：

图2.2 基于验证集的模型选择1
图2.3 基于验证集的模型选择2

如何选择(K)?
通常，(K)取样本总数的1/5。

图2.4 基于验证集的模型选择3

注意：validation不见得比较慢（训练数据变少了）。

图3.1 留一交叉验证1
图3.2 留一交叉验证2
图3.3 留一交叉验证3

留一交叉验证速度慢以及存在不稳定性，实际中通常不怎么用。
将留一中的一个变为一份 ------> V折交叉验证。
V常取5或10。

图4.1 V折交叉验证1
图4.2 V折交叉验证2
图4.3 验证相关方法小结

相关阅读:
小数的编程
小数的编程
硬币趣味题
硬币趣味题
好玩的 emoji
ThreadPoolExecutor使用介绍
希尔排序
OpenCms创建站点过程图解——献给OpenCms的刚開始学习的人们
Linux C 编程内存泄露检測工具(二)：memwatch
C++封装、继承、多态

原文地址：https://www.cnblogs.com/cherrychenlee/p/10800303.html