[机器学习] 一文了解欠拟合与过拟合

2023年7月16日上午9:48 • 人工智能 • 阅读 57

过拟合： 在模型训练中，如果一味追求对训练数据拟合的准确性，所得到的模型往往参数过于复杂，此时的模型学习能力太强，以至于将训练集单个样本自身的特点都能捕捉到，并将其认为是”一般规律”。对未知数据的预测能力却很差。

欠拟合： 常常在模型学习能力较弱，而数据复杂度较高的情况出现，此时模型由于学习能力不足，无法学习到数据集中的”一般规律”。

在数据集层面上理解：
过拟合：训练集上表现得很好，但测试集上表现得并不好。
欠拟合：训练集上和测试集上表现得都不好。

在实际情况中，欠拟合是容易克服的，如在决策树学习中拓展分支、神经网络学习中增加训练轮数。而解决过拟合是一个障碍，且过拟合是无法彻底避免的，但可以缓解和减小。

解决过拟合选项：
1、减少特征的数量，选择要保留的特征。
2、正则化（保留所有特征，但减少参数的大小/值。）

E.g.
1、高维数据会带来计算效率低和过拟合问题，可以减少维度。
2、logistics回归可以通过添加正则化项解决过拟合
3、如果决策树很复杂，需要用剪枝来减少复杂度避免过拟合。
4、BP神经网络中，采用提前停止策略防止过拟合（在训练过程中如果训练集误差率降低的同时，测试集的误差在升高时，就可以停止训练）。

值得一提的是在logistics回归中可以添加正则化项（各个参数的平方和的平均值）的方式解决过拟合： 正则化项为： (λ/2m)∑θi^2（1

欢迎留言讨论或补充~

Original: https://blog.csdn.net/qq_52878933/article/details/124158822
Author: uniqmintmoss
Title: [机器学习] 一文了解欠拟合与过拟合

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/696159/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

从零带你入门stylegan~stylegan3的技术细节

入门级文章，讲解stylegan ~ stylegan3的模型发展部分地方融入个人理解，所以专业性略有不足，希望谅解。但更方便新手的入门理解，愿能够帮助大家进行理解。如果您已对此十…

人工智能 2023年5月26日
00357
动手学习深度学习09—-Softmax 回归 + 损失函数 + 图片分类数据集

图片分类数据集课程中使用的数据集是 FashionMNIST首先看如何下载使用这个数据集： import torch import torchvision from torch….

人工智能 2023年6月17日
0055
Ubuntu20.04下载opencv3.4–未完善

最近在学习slam14讲这本书，第5讲中需要下载opencv3.1，（这个是一个ubuntu20.04下载opecv3.1的博客，不过后来我报了一些依赖的错，懒的解决了，就没有用了…

人工智能 2023年7月19日
0060
windows 10编译安装detectron2（0.2.1）

windows 10编译安装detectron2（0.2.1）基础环境 anaconda3 pytorch1.6 python 3.6 cuda10.2 vs2019 1、下载d…

人工智能 2023年5月26日
0087
R语言ggplot2可视化：指定标题的坐标轴位置（X轴坐标和Y轴坐标），将图像的标题（title）放置在图像内部的指定位置、图像内部的左上、左下、右上、右下（top/bottom left/right

### 回答1：在 Matlab GUI 中设置坐标轴_可以使用函数 “axes”。例如，可以使用以下代码在 GUI 中创建一个 _坐标轴_并将其命名为…

人工智能 2023年7月15日
0082
pytorch初学笔记（二）：TensorBoard的使用

目录一、SummaryWriter类的介绍 1. 定义 2. SummaryWriter初始化 2.1 初始化 2.2 帮助文档给出的使用范例 2.3 常用方法二、add_sc…

人工智能 2023年7月22日
0069
PyTorch1.11.0 GPU版本安装（python3.8+pyTorch1.11.0，torch1.11.0+cu113 torchvision0.12.0+cu113）

目录一、电脑相关信息二、安装Pytorch1.11.0 GPU版本 1. 准备：新建虚拟环境 2. 安装pytorch v1.11.0：（在pytorch官网的历史版本里找安装…

人工智能 2023年7月4日
00119
常用的激活函数

激活函数的作用引入非线性因为神经网络中每一层的输入输出都是一个线性求和的过程，下一层的输出只是承接了上一层输入函数的线性变换，所以如果没有激活函数，那么无论你构造的神经网络…

人工智能 2023年6月28日
00116
100个python算法超详细讲解：牛顿迭代法求方程根

1．问题描述编写用牛顿迭代法求方程根的函数。方程为ax 3 +bx 2 +cx+d=0，系数a、b、c、d由主函数输入，求x在1附近的一个实根。求出根后，由主函数输出。 2．问题分…

人工智能 2023年6月16日
0061
统计学习：模型评估与选择–留出法（python实现）

使用测试集来测试学习器对新样本的判别能力，然后在测试集上的”测试误差”作为泛化误差的近似，且假设测试样本是从样本真实分布中独立同分布采用而得。这样的目的也…

人工智能 2023年7月17日
0090
条件随机场（CRF）的详细解释

条件随机场(CRF)由Lafferty等人于2001年提出，结合了最大熵模型和隐马尔可夫模型的特点，是一种无向图模型，常用于标注或分析序列资料，如自然语言文字或是生物序列。近年来在…

人工智能 2023年5月27日
0082
机器学习西瓜书&南瓜书线性模型

机器学习西瓜书&南瓜书线性模型 1. 基本形式给定由d个属性描述的示例x = ( x 1 ; x 2 ; . . . x d ) x=(x_1;x_2;…x…

人工智能 2023年6月17日
0067
dataframe常用API(python)

文章目录创建dataframe select collect count limit distinct filter flatMap&map groupBy & …

人工智能 2023年7月8日
0090
技术内幕 | StarRocks Community Champion、阿里云技术专家解读 Optimizer 实现

作者：范振（花名辰繁），阿里云计算平台-开源大数据-OLAP方向负责人，高级技术专家，StarRocks Community Champion 随着阿里云EMR StarRocks…

人工智能 2023年7月31日
0048
anaconda安装opencv

如何在anaconda里安装opencv？一.用anaconda prompt安装 1>在开始菜单里面点击anaconda 在里面找到prompt（附打开界面） 2>…

人工智能 2023年7月19日
0052
基于产生式的动物识别专家系统_海洋技术一种多源信息融合的声呐综合目标识别方法…

点击上方 “溪流之海洋人生”即可订阅哦声呐目标识别是基于声呐装备发现目标的前提下，声呐操作员依据声呐装备探测目标信息，利用图谱分析、听音识别、运动要素分析…

人工智能 2023年6月10日
0081

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

[机器学习] 一文了解欠拟合与过拟合

大家都在看