训练集、验证集、测试集的作用

2023年7月28日下午9:08 • 人工智能 • 阅读 84

1. 前言

本篇是看完吴恩达老师DL的课，写来当笔记看的，若有错误与疑虑，请指正或提出。

2. 训练集、验证集、测试集的作用

训练集（ Training set）的作用： 更新模型参数。

验证集（开发集）(Dev set) 的作用： 评估训练得到的多种不同模型或者是带着不同参数的同一模型的效果，再根据模型在验证集的效果 对模型进行选择和调参（因此可以说验证集也参与了训练），使得模型效果在验证集达到最优，最后选出效果最好的模型。

测试集(Test set) 的作用： 对最终筛选出来模型的泛化能力进行评价。 测试集最重要的是未知，即用一个学习集之外的数据集来对模型的效果进行评估，看看模型能否给出合适的输出；就像是用一张你平时刷题没刷到过的题组成的卷子，来检验你对知识的掌握情况，这样才合理嘛。

另外，我想提一下这个：对于测试集的作用，Ng原话是： 对最终选定模型的性能进行无偏估计。我刚看课程时是云里雾里的，后面发现对于测试集作用，两句话其实是一个意思😑。
下面为个人理解： 无偏估计（概率论的东西），就是估计量的期望值等于被估计量的真实值。最重要的是这一句： 样本均值的期望是总体均值的无偏估计。证明如下：（专门开个word写一遍。。）

上面是纯概率论的东西，现在把它代入到深度学习里面。把模型的 性能评价指标（误差、准确度什么的）当成是随机变量X，在有n个数据的测试集上，你计算n个数据得到的n个指标值(即上面的X1~Xn)，再除以n，不就得到样本均值的期望了（这里的样本是指标的值，不是指数据集里的那种样本）。根据 样本均值的期望是总体均值的无偏估计，所以 计算测试集上的性能评价指标平均值其实就是在对模型的总体性能做无偏估计，这个过程同时也是 在对模型泛化性能进行评价。

3. 一些杂碎的东西

一切试图提升效果的改变都会导致过拟合。比如对训练集的过拟合：你用梯度下降的方式对 模型参数进行多次的调整，来降低train loss，经过多次调整后，模型对于训练集的拟合效果会特别好，然而对于验证集的拟合可能效果就不是特别好（就是泛化能力差），这就导致了过拟合。亦或者是验证集的过拟合：你每次训练完若干批样本后，要用验证集对模型性能进行评估，然后 多次调整超参数，让模型在验证集上的性能变得更好，这其实会在超参数层面的过拟合了。

二者都有对模型效果进行评估的作用，它们最重要的区别在于对于模型是否未知。在用验证集进行人工调参的过程中，验证集对于模型是已知的。验证集在被 反复使用，用于让模型朝着对验证集拟合甚至过拟合的方向前进，所以 测试集的数据是肯定不能和验证集的数据混杂在一起的：混杂在一起就好比就是你把期末考试的题（未知）泄露到期末考前模拟题（已知）里面，这样期末考出来成绩虚高（在这个泄露数据的测试集里，模型性能指标好），学生可能没真正掌握知识点（泛化能力差，导致对于学习集之外的样本可能给不出合适的输出）；而测试集仅仅使用一次来评价你调整完的最终模型的性能。

以下都是Ng课上提到的thumb rules：

比如对识别猫这一任务，你训练的图片可能是高像素、经过后期处理的；而你的验证样本和测试样本来源于用户手机随手拍的模糊猫图，这就导致样本分布不匹配的问题。而验证集是用来对多个模型性能进行评估和对模型性能进一步优化，我们是选择在验证集上效果最好的模型作为最终模型，并在测试集上进行模型性能评估。 因此，要保证验证样本和测试样本来自同一分布。

测试集不是必要的，训练集和验证集才是必要的。你要通过训练集让模型不断地学习新东西，然后用验证集来判断模型效果的好坏，然后调整模型，多次迭代得到最终模型。你得到最终模型靠的是训练集和验证集，测试集只不过是对你最终模型的效果进行评估而已。

4.参考来源

Original: https://blog.csdn.net/coolyuan/article/details/122628830
Author: 渊桑
Title: 训练集、验证集、测试集的作用

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/721152/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

图像分类竞赛涨分小技巧——以智能硬件语音控制的时频图分类挑战赛为例

图像分类竞赛涨分小技巧一. 前言二. 上分小技巧 * 2.1 数据分割 2.2 数据增强 – 2.2.1 随机擦除(Random Erase) 2.2.2 混类增强…

人工智能 2023年7月1日
0078
进程间通信–共享内存篇

文章目录共享内存的概念共享内存使用须知 * 创建共享内存共享内存的映射与链接共享内存的映射取消共享内存的删除共享内存实现进程通信总结共享内存的概念共享内存字面理解…

人工智能 2023年7月30日
0085
大数据和人工智能属于什么专业 – 学大数据和人工智能出来做什么

人工智能专业主要从事什么工作？ 1、算法工程师。进行人工智能相关前沿算法的研究，包括机器学习、知识应用、智能决策等技术的应用。以机器学习的过程为例，涉及到数据收集、数据整理、算法设…

人工智能 2023年7月13日
00103
人工智能练习题 + 知识点汇总（期末复习版）

目录第一章人工智能绪论第二章知识与谓词第三章谓词与自然演绎推理第四章语义网表示法和框架表示法第五章归结原理第六章置换和合一第七章定理证明和问题求解第八…

人工智能 2023年7月30日
0075
Educode–机器学习基础模型与算法测试闯关实验

第1关：线性回归模型应用实现代码： –– coding: utf-8 –– ”’ 油气藏的储量密度Y与生油…

人工智能 2023年6月23日
00119
树莓派-14-打造智能音箱

人工智能 2023年5月23日
0079
关于pytorch在训练模型时常见错误

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

人工智能 2023年7月22日
0053
Pytorch加载模型只导入部分层权重，即跳过指定网络层的方法

Pytorch加载模型时，只导入部分层权重，跳过部分指定网络层。（权重文件存储为dict形式）常见方法：加载权重时用if对网络层进行筛选 ”’ model为定义的网络结构： c…

人工智能 2023年6月16日
0091
面试官：说一下SSO 单点登录和 OAuth2.0 的区别

一、概述 SSO是Single Sign On的缩写，OAuth是Open Authority的缩写，这两者都是使用令牌的方式来代替用户密码访问应用。流程上来说他们非常相似，但概念…

人工智能 2023年6月27日
0066
移动端 [Android iOS] 定制编译 tensorflow-lite

文章目录 * – 需求 – 环境 – 过程 – + 下载 tf-lite 源码 + 环境配置 + 尝试编译 + 扩展代码 + 接口提…

人工智能 2023年5月24日
0078
机器学习作业之波士顿房价（boston）数据分析与绘图（注释我都写了这么多，我不信你还看不懂？）

目录一、前言二、简单介绍头文件 * 1、sklearn头文件 – 意外 2、其他头文件三、题目理解 * 1、题目的简单介绍 2、属性标签 3、降维比喻四、代码 …

人工智能 2023年7月15日
00113
python3下载及安装教程

Python目前已支持所有主流操作系统，在Linux,Unix,Mac系统上自带Python环境，一般默认装的是Python2版本，Windows系统上没有Pyhton环境，需要我…

人工智能 2023年7月5日
0065
前端爱心代码跟个风

光棍节New一个对象发给Ta(有编译器的用编译器，没有的可以用记事本）在电脑桌面新建一个txt文本文档，复制下面的代码进去并保存，把文件名.txt的后缀改为.html，然后双击文…

人工智能 2023年6月26日
0080
opencv-python图像处理：Canny边缘检测算法，模板匹配，直方图均衡化，傅里叶变换

1 Canny边缘检测流程 1）使用高斯滤波器，以平滑图像，滤除噪声2）计算图像中每个像素点的梯度强度和方向3）应用非极大值抑制，以消除边缘检测带来的杂散响应4）应用双阈值检测来确…

人工智能 2023年6月18日
0084
pytorch中torchvision.transforms.functional模块中pad函数的使用

torchvision.transforms.functional模块中pad函数的使用载入torchvision.transforms.functional模块 import …

人工智能 2023年7月22日
0050
MySQL数据库 | SQL语句详解

DDL解释： 1.数据库的常用操作 2.表结构的常用操作 3.修改表结构查看所有的数据库show databases; 创建表格式 use mydb3; create table…

人工智能 2023年7月30日
0054

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

训练集、验证集、测试集的作用

1. 前言

2. 训练集、验证集、测试集的作用

3. 一些杂碎的东西

4.参考来源

大家都在看