【深度学习】2-模型在测试集的准确率大于训练集

2023年6月23日下午9:59 • 人工智能 • 阅读 99

🚩 前言

🚩 活动地址：CSDN21天学习挑战赛
🚀 博主主页：清风莫追

保持输入，保持输出！（引用我某朋友的一句话）

文章目录

🚩 前言
1. 问题描述
2. 解决问题
*
2. 1. 欠拟合
2. 2. 小批量统计的滞后性
小结
问题描述

在模型训练过程中突然发现，模型的准确率在测试集上居然比在训练集上还要高。但是我们知道，我们训练模型的方式就是 在训练集上最小化损失。因此，模型在训练集上有着更好的表现，才应该是正常的现象。
那么，是什么导致了在测试集上准确率更高的现象呢？

模型训练结果：

; 2. 解决问题

2. 1. 欠拟合

后来我咨询了某大佬，她说：” 多训练几次看看，前几次一直在欠拟合“，我顿时感觉， 好建议！

增加训练周期数：

果然！随着 训练周期的增加，模型准确率慢慢地回归了正轨。在训练集上的准确率又超过了测试集上的。

; 2. 2. 小批量统计的滞后性

但我依然有所疑惑，为什么在训练周期较少的欠拟合状态下，会出现模型在测试集上准确率更高的情况呢？它们之间有什么关系？
有一篇博文给出的部分解释，我觉得很合理，比较符合我遇到的情况：

训练集的准确率是每个batch之后产生的，而验证集的准确率一般是一个epoch后产生的，验证时的模型是训练一个个batch之后的，有一个滞后性，可以说就是用训练得差不多的模型用来验证，当然准确率要高一点。

也就是说，问题的出现和个人具体统计训练集准确率的方式有关。如果是在每个 训练周期结束后再统计训练集上的模型准确率，而不是在每个 小批量结束就统计，那就不会出现这样的问题。
当然，光说是不行的，得实践。我检查了之前的模型代码，发现我训练集上的准确率确实是每个小批量结束后就统计的。那不妨试试训练集的准确率也在每个周期结束后再进行统计。

每个训练周期后再统计训练集上的准确率（ train acc 2):

容易发现，即使在欠拟合的状态下，如果训练集和测试集准确率的统计方式相同，模型还是会在训练集上的准确率更高。

参考文献：
神经网络与深度学习—验证集（测试集）准确率高于训练集准确率的原因

小结

遇到问题，看一看别人的想法，可能会让自己瞬间茅塞顿开。一个人钻牛角尖不可取。

Original: https://blog.csdn.net/m0_63238256/article/details/126217060
Author: 清风莫追
Title: 【深度学习】2-模型在测试集的准确率大于训练集

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/647973/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

1044 Shopping in Mars

Shopping in Mars is quite a different experience. The Mars people pay by chained diamonds….

人工智能 2023年6月28日
0074
文献阅读1-Underwater object detection using Invert Multi-Class Adaboost with deep learning

使用多反转级Adaboost算法实现水下目标检测摘要 * 关键词背景创新点方法实验结论与不足 – 参考摘要本文提出了一种新新的水下目标识别算法，基于深度…

人工智能 2023年7月12日
0064
开发环境 – pip install cv2下载失败的解决办法

1. 出错现象1.1 源代码import cv2失败 import cv2ImportError: No module named cv2 1.2 conda install cv…

人工智能 2023年7月19日
00107
使用 Keras 在 Python 中使用 LSTM 递归神经网络进行时间序列预测

From sztu 自动化专业的小菜鸡。时间序列预测问题是一种困难类型的预测建模问题。与回归预测建模不同，时间序列还增加了输入变量之间序列依赖性的复杂性。在这篇文章中，您将了…

人工智能 2023年7月12日
0056
【原创】BERT知识融合

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月27日
0066
【负荷预测】10KV馈线负荷预测

### 回答1： cpw馈电是一种微带线结构，常用于高速数字和射频信号传输。在进行高频电磁仿真时，HFSS是一种常用的软件。使用HFSS对cpw馈电进行仿真，可以分析它的电磁性能。…

人工智能 2023年7月8日
0070
讯飞语音识别_讯飞语音识别提取版v2.1.0.1712

Original: https://blog.csdn.net/weixin_34526152/article/details/112738664Author: 睿心冥想Title…

人工智能 2023年5月25日
0072
Python学习4-谱聚类

一，谱聚类原理谱聚类算法原理可以参考如下链接。这个视频推导出了拉普拉斯矩阵，但没有更新后续优化问题。机器学习-白板推导系列(二十二)-谱聚类（Spectral Cluster…

人工智能 2023年6月2日
0089
C++下GDAL的详细使用案例（含项目配置、tif读取为cv::Mat、Mat保存为tif）

1、GDAL的安装与配置 1.1 GDAL的下载安装直接到下列链接下载即可，按照说明，将bin目录添加的系统环境变量中即可 windows下GDAL322的库-深度学习文档类资源…

人工智能 2023年6月18日
00150
实战1 – 空气质量数据的校准

1 题目简介题目来源于2019 高教社杯全国大学生数学建模竞赛D题——空气质量数据的校准。空气污染对生态环境和人类健康危害巨大，通过对”两尘四气”（PM2…

人工智能 2023年6月19日
0067
Android 标题栏及导航栏设计与实现

文章目录 * – + * 整体演示 – 一、Toolbar实现顶部标题 – + 1、案例演示 + 2、实现步骤 + * 2.1、隐藏页面自带标题…

人工智能 2023年6月28日
0081
Python实现朴素贝叶斯分类器

朴素贝叶斯分类器文章目录朴素贝叶斯分类器一、贝叶斯分类器是什么？ * 贝叶斯判定准则朴素贝叶斯分类器举个栗子二、相关代码 * 1.数据处理 2.生成朴素贝叶斯表（字典）…

人工智能 2023年7月5日
0094
统计学第八版贾俊平课后答案

4.2随机抽取25个网络用户，得到他们的年龄数据如表所示。网络用户的年龄数据（单位：周岁）要求：（1）计算众数、中位数。（2）计算四分位数。（3）计算平均数和标准差。（4）计…

人工智能 2023年6月15日
00459
地平线计划迎新历程，Zebec Chain有望成为公链赛道新兴生力军

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月27日
0095
大数据技术之Hadoop（入门）概述、运行环境搭建、运行模式

文章目录 1 Hadoop 概述 * 1.1 Hadoop 是什么 1.2 Hadoop 优势 1.3 Hadoop 组成（面试重点） – 1.3.1 HDFS 架构概…

人工智能 2023年7月30日
0066
机器学习中—sklearn对于鸢尾花如何进行数据集划分

机器学习中，我们熟知的开发流程是：获取数据——数据处理——特征工程——机器学习算法训练模型—&#…

人工智能 2023年7月18日
0055

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

【深度学习】2-模型在测试集的准确率大于训练集

文章目录

2. 1. 欠拟合

; 2. 2. 小批量统计的滞后性

大家都在看