深度学习理论（李宏毅

2023年6月17日上午4:40 • 人工智能 • 阅读 87

2022 – 再探宝可梦、数码宝贝分类器 — 浅谈机器学习原理_哔哩哔哩_bilibili

more parameters, easier to overfit, why?

但是怎么定这个有未知数的function呢、那通常假设你没有什么想法的话、往往你需要先对你的资料做一些观察、想象一下，假设有一个function可以成功的分类宝可梦跟数码宝贝、那这个function它应该长什么样子

所以，开始进行机器学习之前，也许我们先对资料进行一些观察。

好在经过一番观察以后。我发现他们虽然长得很像，但其实还是有显著差异：画风不同

很多package呢可以帮你把一个图片里面的线呢把它画出来。细节不重要，总之扣一个library自动会产生这种边线的图

那怎么知道一张图片的边线比较简单还是复杂呢？算一下图里白色的pixel有多少

e函数代表，线条的复杂程度

func. f只有一个未知参数h

这个func. f完全可以一般化到更复杂的情景，比如 h可以换成之前录音里讲过的θ

未知参数所有的可能性集合起来叫 H，他的可能性是你自己决定的，这里我们假设说做完边缘探测后白色点的数目不会超过1万，这里不需要考虑小数点

|H| 在H里有多少可能的选择，这个数叫做模型的复杂程度

模型的复杂程度很高，代表说他现在定出来的这个含有未知数的func.里面，选择性很多

接下来我们来定loss，

首先要有资料, loss是根据资料计算出来的，

给一个h，根据某一组dataset来计算loss

训练资料集，有个假设，训练资料集里的每一笔资料，是从一个更大的资料里被sample出来的，sample的过程有一个限制叫i.i.d.，独立同分布，即 sample每一笔资料时每笔之间是independent，每次sample时分布永远是固定的，

有了D(train)之后，就可以找出一个h，让用Dtrain所计算出的loss值越小越好

期待理想和现实越接近越好，理想是找到一个h(all)，用在D(all)上得到一个loss

h(train)和h(all)显然不同，因为是从不同的资料里找出来的，他们要minimize的loss func.是不一样的，loss func.不只是和h有关，也和define这个loss func.的资料有关

h(all)是D(all)上最好的h，

h(train)和h(all)到底有多大差距？

实际应用里，收集D(all)显然不切实际，所以常见做法是准备一个D(test)，是从D(all)sample出来的，你期待这个D(test)对所有data是有代表性的

假设图鉴里的819只宝可梦和971只digimon已经非常充足了，来看看分布长什么样？

我们把他的线条复杂程度画出来，分布如图，

纵轴代表有这种负责度的动物的个数

问题：even lower than h(all)？

但是，h(all)最低是说他在D(all) 这组data上、他的loss最低。并不代表他在所有可能的资料集上，他的loss 是最低的。

我们真正关心的是如果我们把h(train)用在D(all)上时，错误率是多少。

从D(train2)例子我们得到结论，结果好坏取决于你sample到什么样的资料

什么叫好的trainning data 用数学式表示：

δ是一个你自己设的数值，看你希望理想跟现实有多接近。大一点可以是0.1，小一点可以是0.00001

你只要能够sample到一个trainning的资料，满足：

对所有的h而言，计算在D(train)上跟计算在D(all)上面的loss 差距

Original: https://blog.csdn.net/linyuxi_loretta/article/details/127327104
Author: linyuxi_loretta
Title: 深度学习理论（李宏毅

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/628586/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

sklearn安装后无法调用的问题

sklearn安装后无法调用的问题出现的问题网页上随便复制了一段使用sklearn的代码之后，发现出错了代码跑起来之后是缺少sklearn模块 ; 解决思路 1）按照网上的思路…

人工智能 2023年7月26日
0057
2021年度十大开源SLAM算法

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

人工智能 2023年7月27日
0058
kaggle房价预测-回归模型

目录 1 项目背景 2 初始数据分析目标值分析特征与目标值相关性变量特征相关性 3 数据预处理目标变量正态分布化异常值处理缺失值处理转换特征保存训练集和测试集 4 …

人工智能 2023年7月4日
0082
机器学习常见评价指标

机器学习常见评价指标 0 引言 \qquad在建模的时候，不论是一般机器学习还是深度学习，都要有评价指标进行模型效果的衡量，评价指标是对于一个模型效果的数值型量化。一般来说，评价指…

人工智能 2023年6月16日
00107
机器学习强基计划2-1：一文总结熵——交叉熵、相对熵、互信息(附例题分析)

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped …

人工智能 2023年6月2日
0051
“OSError: [WinError 1455]页面文件太小，无法完成操作。”解决方案

“OSError: [WinError 1455]页面文件太小，无法完成操作”解决方案引言 1 问题原因 2 解决方案引言某次在Windows系统上跑…

人工智能 2023年7月29日
00100
【进阶篇】全流程学习《20天掌握Pytorch实战》纪实 | Day03 | 文本数据建模流程范例

💖作者简介：大家好，我是车神哥，府学路18号的车神🥇⚡About—> 车神：从寝室到实验室最快3分钟，最慢3分半（那半分钟其实是等红绿灯）📝个人主页：车手只需…

人工智能 2023年7月22日
0073
Hive实战 —— 利用Hive进行数据分析并将分析好的数据导出到mysql数据库中

🙆‍♂️🙆‍♂️ 写在前面 🏠 个人主页：csdn春和📚 推荐专栏：更多专栏尽在主页！JavaWeb专栏（从入门到实战超详细！！！）SSM专栏（更新中…）📖 …

人工智能 2023年7月15日
0078
数据分析笔记05

在pandas模块中，有很多索引方式来定位和选择DataFrame中的数据行索引一列和多列数据访问，列索引 .loc .iloc一列一列地操作也可以一次性访问多列数据dat…

人工智能 2023年7月8日
0068
Java之JvisualVM简介

一、工具： JvisualVM，安装JDK时自带的，不需要额外安装；下面条目展示在本地使用的步骤。二、打开方法： 1、本地启动Java服务后，保持运行；打开终端，输入jps命令回…

人工智能 2023年6月28日
0069
【机器学习】基于天气数据集的XGBoost分类与预测

目录一、学习知识点概要二、学习内容 * 代码 – 1.导入库 2.对离散变量进行编码 3.利用 XGBoost 进行训练与测试 4.利用 XGBoost 进行特征选…

人工智能 2023年7月2日
0047
机器学习算法结果评估指标

机器学习算法评估指标 1. 混淆矩阵 1.1 定义：混淆矩阵的每一列代表了预测类别，每一列的总数表示预测为该类别的数据的数目；每一行代表了数据的真实归属类别，每一行的数据总…

人工智能 2023年7月3日
0073
什么是分辨率

分辨率指的是图像或者显示屏在长和宽上各拥有的像素个数。比如一张照片分辨率为1920×1080，意思是这张照片是由横向1920个像素点和纵向1080个像素点构成，一共包含…

人工智能 2023年6月18日
0068
yolov7.yaml文件详解

1、parameters （1）nc代表目标检测所检测的种类（2）depth_multiple：控制通道的深度的系数，表示channel的缩放系数，就是将配置里面的backbon…

人工智能 2023年7月28日
0068
hard negative mining结合实现代码进行总结

做法:hard negative mining 应运而生.它的想法就是在训练时,尽量多挖掘一些难的负例样本加入样本集,这样会比那些简单的负例样本对分类器的优化更有效.因为大量的容易…

人工智能 2023年7月10日
0084
【PIE-Engine Studio学习笔记05】图像分类——非监督分类

【PIE-Engine Studio学习笔记05】图像分类——非监督分类一、图像分类含义图像分类是将图像中每个像元根据其在不同波段的光谱亮度、空间结构特征或者其他信息，按照某种…

人工智能 2023年7月3日
00107

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

深度学习理论（李宏毅

大家都在看