YOLOv5网络详解

2023年7月12日下午4:43 • 人工智能 • 阅读 61

官方源码仓库：https://github.com/ultralytics/yolov5
文章下载地址：没有

视频讲解：https://www.bilibili.com/video/BV1T3411p7zR

文章目录

*
– 0 前言
– 1 网络结构
– 2 数据增强
– 3 训练策略
– 4 其他
–
+ 4.1 损失计算
+ 4.2 平衡不同尺度的损失
+ 4.3 消除Grid敏感度
+ 4.4 匹配正样本(Build Targets)

0 前言

在前面我们已经介绍过了YOLOv1~v4的网络的结构，今天接着上次的YOLOv4再来聊聊YOLOv5，如果还不了解YOLOv4的可以参考之前的博文。YOLOv5项目的作者是 Glenn Jocher并不是原 Darknet项目的作者 Joseph Redmon。并且这个项目至今都没有发表过正式的论文。之前翻阅该项目的 issue时，发现有很多人问过这个问题，有兴趣的可以翻翻这个issue #1333。作者当时也有说准备在2021年的12月1号之前发表，并承诺如果到时候没有发表就吃掉自己的帽子。

(⊙o⊙)…，emmm，但这都2022年了，也不知道他的帽子是啥味儿。过了他承诺的发表期限后，很多人还去该 issue下表示”关怀”，问啥时候吃帽子，下面这位大哥给我整笑了。

本来 Glenn Jocher是准备要发表论文的，但至于为啥没发成作者并没有给出原因。我个人的猜测是自从YOLOv4发表后，有很多人想发这方面的文章，然后在YOLOv4上进行改动，改动过程中肯定有人把YOLOv5仓库里的一些技术拿去用了（YOLOv4论文4月出的，YOLOv5仓库5月就有了）。大家改完后发了一堆文章，那么YOLOv5的技术就被零零散散的发表到各个文章中去了。 Glenn Jocher一看，这也太卷了吧，你们都把我技术写了，那我还写个锤子，直接撂挑子不干了。

当然以上都是我个人yy哈，回归正题，YOLOv5仓库是在 2020-05-18创建的，到今天已经迭代了很多个大版本了，现在（ 2022-3-19）已经迭代到 v6.1了。所以本篇博文讲的内容是针对 v6.1的，大家阅读的时候注意看下版本号，不同的版本内容会略有不同。前几天我在YOLOv5项目中向作者提了一个issue #6998，主要是根据当前的源码做了一个简单的总结，然后想让作者帮忙看看总结的内容是否有误，根据作者的反馈应该是没啥问题的，所以今天就来谈谈我个人的见解。下表是当前(v6.1)官网贴出的关于不同大小模型以及输入尺度对应的 mAP、推理速度、参数数量以及理论计算量 FLOPs。

Modelsize

(pixels)mAPval

0.5:0.95mAPval

0.5Speed

CPU b1

(ms)Speed

V100 b1

(ms)Speed

V100 b32

(ms)params

(M)FLOPs

@640 (B)YOLOv5n64028.045.7
45 6.3 0.6 1.9 4.5

YOLOv5s64037.456.8986.40.97.216.5YOLOv5m64045.464.12248.21.721.249.0YOLOv5l64049.067.343010.12.746.5109.1YOLOv5x64050.768.976612.14.886.7205.7YOLOv5n6128036.054.41538.12.13.24.6YOLOv5s6128044.863.73858.23.612.616.8YOLOv5m6128051.369.388711.16.835.750.0YOLOv5l6128053.771.3178415.810.576.8111.4YOLOv5x6

TTA1280

153655.0

55.8

72.7

72.7

3136

-26.2

-19.4

-140.7

-209.8

; 1 网络结构

关于YOLOv5的网络结构其实网上相关的讲解已经有很多了。网络结构主要由以下几部分组成：

Backbone: New CSP-Darknet53
Neck: SPPF, New CSP-PAN
Head: YOLOv3 Head

下面是我根据 yolov5l.yaml绘制的网络整体结构，YOLOv5针对不同大小（ n, s, m, l, x）的网络整体架构都是一样的，只不过会在每个子模块中采用不同的深度和宽度，分别应对 yaml文件中的 depth_multiple和 width_multiple参数。还需要注意一点，官方除了 n, s, m, l, x版本外还有 n6, s6, m6, l6, x6，区别在于后者是针对更大分辨率的图片比如 1280x1280，当然结构上也有些差异，后者会下采样64倍，采用4个预测特征层，而前者只会下采样到32倍且采用3个预测特征层。本博文只讨论前者。下面这幅图（ yolov5l）有点大，大家可以下载下来仔细看一下。

通过和上篇博文讲的YOLOv4对比，其实YOLOv5在 Backbone部分没太大变化。但是YOLOv5在 v6.0版本后相比之前版本有一个很小的改动，把网络的第一层（原来是 Focus模块）换成了一个 6x6大小的卷积层。 两者在理论上其实等价的，但是对于现有的一些GPU设备（以及相应的优化算法）使用 6x6大小的卷积层比使用 Focus模块更加高效。详情可以参考这个issue #4825。下图是原来的 Focus模块(和之前 Swin Transformer中的 Patch Merging类似)，将每个 2x2的相邻像素划分为一个 patch，然后将每个 patch中相同位置（同一颜色）像素给拼在一起就得到了4个 feature map，然后在接上一个 3x3大小的卷积层。这和直接使用一个 6x6大小的卷积层等效。

在 Neck部分的变化还是相对较大的，首先是将 SPP换成成了 SPPF（ Glenn Jocher自己设计的），这个改动我个人觉得还是很有意思的，两者的作用是一样的，但后者效率更高。 SPP结构如下图所示，是将输入并行通过多个不同大小的 MaxPool，然后做进一步融合，能在一定程度上解决目标多尺度问题。

而 SPPF结构是将输入串行通过多个 5x5大小的 MaxPool层，这里需要注意的是串行两个 5x5大小的 MaxPool层是和一个 9x9大小的 MaxPool层计算结果是一样的，串行三个 5x5大小的 MaxPool层是和一个 13x13大小的 MaxPool层计算结果是一样的。

下面做个简单的小实验，对比下 SPP和 SPPF的计算结果以及速度，代码如下（注意这里将 SPPF中最开始和结尾处的 1x1卷积层给去掉了，只对比含有 MaxPool的部分）：

import time
import torch
import torch.nn as nn

class SPP(nn.Module):
    def __init__(self):
        super().__init__()
        self.maxpool1 = nn.MaxPool2d(5, 1, padding=2)
        self.maxpool2 = nn.MaxPool2d(9, 1, padding=4)
        self.maxpool3 = nn.MaxPool2d(13, 1, padding=6)

    def forward(self, x):
        o1 = self.maxpool1(x)
        o2 = self.maxpool2(x)
        o3 = self.maxpool3(x)
        return torch.cat([x, o1, o2, o3], dim=1)

class SPPF(nn.Module):
    def __init__(self):
        super().__init__()
        self.maxpool = nn.MaxPool2d(5, 1, padding=2)

    def forward(self, x):
        o1 = self.maxpool(x)
        o2 = self.maxpool(o1)
        o3 = self.maxpool(o2)
        return torch.cat([x, o1, o2, o3], dim=1)

def main():
    input_tensor = torch.rand(8, 32, 16, 16)
    spp = SPP()
    sppf = SPPF()
    output1 = spp(input_tensor)
    output2 = sppf(input_tensor)

    print(torch.equal(output1, output2))

    t_start = time.time()
    for _ in range(100):
        spp(input_tensor)
    print(f"spp time: {time.time() - t_start}")

    t_start = time.time()
    for _ in range(100):
        sppf(input_tensor)
    print(f"sppf time: {time.time() - t_start}")

if __name__ == '__main__':
    main()

终端输出：

True
spp time: 0.5373051166534424
sppf time: 0.20780706405639648

通过对比可以发现，两者的计算结果是一模一样的，但 SPPF比 SPP计算速度快了不止两倍，快乐翻倍。

在 Neck部分另外一个不同点就是 New CSP-PAN了，在YOLOv4中， Neck的 PAN结构是没有引入 CSP结构的，但在YOLOv5中作者在 PAN结构中加入了 CSP。详情见上面的网络结构图，每个 C3模块里都含有 CSP结构。在 Head部分，YOLOv3, v4, v5都是一样的，这里就不讲了。

2 数据增强

在YOLOv5代码里，关于数据增强策略还是挺多的，这里简单罗列部分方法：

Mosaic，将四张图片拼成一张图片，讲过很多次了
Copy paste，将部分目标随机的粘贴到图片中，前提是数据要有 segments数据才行，即每个目标的实例分割信息。下面是 Copy paste原论文中的示意图。
Random affine(Rotation, Scale, Translation and Shear)，随机进行仿射变换，但根据配置文件里的超参数发现只使用了 Scale和 Translation即缩放和平移。
MixUp，就是将两张图片按照一定的透明度融合在一起，具体有没有用不太清楚，毕竟没有论文，也没有消融实验。代码中只有较大的模型才使用到了 MixUp，而且每次只有10%的概率会使用到。
Albumentations，主要是做些滤波、直方图均衡化以及改变图片质量等等，我看代码里写的只有安装了 albumentations包才会启用，但在项目的 requirements.txt文件中 albumentations包是被注释掉了的，所以默认不启用。
Augment HSV(Hue, Saturation, Value)，随机调整色度，饱和度以及明度。
Random horizontal flip，随机水平翻转

; 3 训练策略

在YOLOv5源码中使用到了很多训练的策略，这里简单总结几个我注意到的点，还有些没注意到的请大家自己看下源码：

Multi-scale training(0.5~1.5x)，多尺度训练，假设设置输入图片的大小为640 × 640 640 \times 640 6 4 0 ×6 4 0，训练时采用尺寸是在0.5 × 640 ∼ 1.5 × 640 0.5 \times 640 \sim 1.5 \times 640 0 .5 ×6 4 0 ∼1 .5 ×6 4 0之间随机取值，注意取值时取得都是32的整数倍（因为网络会最大下采样32倍）。
AutoAnchor(For training custom data)，训练自己数据集时可以根据自己数据集里的目标进行重新聚类生成Anchors模板。
Warmup and Cosine LR scheduler，训练前先进行 Warmup热身，然后在采用 Cosine学习率下降策略。
EMA(Exponential Moving Average)，可以理解为给训练的参数加了一个动量，让它更新过程更加平滑。
Mixed precision，混合精度训练，能够减少显存的占用并且加快训练速度，前提是GPU硬件支持。
Evolve hyper-parameters，超参数优化，没有炼丹经验的人勿碰，保持默认就好。

4 其他

4.1 损失计算

YOLOv5的损失主要由三个部分组成：

Classes loss，分类损失，采用的是 BCE loss，注意只计算正样本的分类损失。
Objectness loss， obj损失，采用的依然是 BCE loss，注意这里的 obj指的是网络预测的目标边界框与GT Box的 CIoU。这里计算的是所有样本的 obj损失。
Location loss，定位损失，采用的是 CIoU loss，注意只计算正样本的定位损失。

L o s s = λ 1 L c l s + λ 2 L o b j + λ 3 L l o c Loss=\lambda_1 L_{cls} + \lambda_2 L_{obj} + \lambda_3 L_{loc}L o s s =λ1 L c l s +λ2 L o b j +λ3 L l o c
其中，λ 1 , λ 2 , λ 3 \lambda_1, \lambda_2, \lambda_3 λ1 ,λ2 ,λ3 为平衡系数。

4.2 平衡不同尺度的损失

这里是指针对三个预测特征层（ P3, P4, P5）上的 obj损失采用不同的权重。在源码中，针对预测小目标的预测特征层（ P3）采用的权重是 4.0，针对预测中等目标的预测特征层（ P4）采用的权重是 1.0，针对预测大目标的预测特征层（ P5）采用的权重是 0.4，作者说这是针对 COCO数据集设置的超参数。
L o b j = 4.0 ⋅ L o b j s m a l l + 1.0 ⋅ L o b j m e d i u m + 0.4 ⋅ L o b j l a r g e L_{obj} = 4.0 \cdot L_{obj}^{small} + 1.0 \cdot L_{obj}^{medium} + 0.4 \cdot L_{obj}^{large}L o b j =4 .0 ⋅L o b j s m a l l +1 .0 ⋅L o b j m e d i u m +0 .4 ⋅L o b j l a r g e

4.3 消除Grid敏感度

在上篇文章YOLOv4中有提到过，主要是调整预测目标中心点相对Grid网格的左上角偏移量。下图是YOLOv2，v3的计算公式。

其中：

t x t_x t x 是网络预测的目标中心x x x坐标偏移量（相对于网格的左上角）
t y t_y t y 是网络预测的目标中心y y y坐标偏移量（相对于网格的左上角）
c x c_x c x 是对应网格左上角的x x x坐标
c y c_y c y 是对应网格左上角的y y y坐标
σ \sigma σ是 Sigmoid激活函数，将预测的偏移量限制在0到1之间，即预测的中心点不会超出对应的 Grid Cell区域

关于预测目标中心点相对Grid网格左上角( c x , c y ) (c_x, c_y)(c x ,c y )偏移量为σ ( t x ) , σ ( t y ) \sigma(t_x), \sigma(t_y)σ(t x ),σ(t y )。YOLOv4的作者认为这样做不太合理，比如当真实目标中心点非常靠近网格的左上角点（σ ( t x ) \sigma(t_x)σ(t x )和σ ( t y ) \sigma(t_y)σ(t y )应该趋近与0）或者右下角点（σ ( t x ) \sigma(t_x)σ(t x )和σ ( t y ) \sigma(t_y)σ(t y )应该趋近与1）时，网络的预测值需要负无穷或者正无穷时才能取到，而这种很极端的值网络一般无法达到。为了解决这个问题，作者对偏移量进行了缩放从原来的( 0 , 1 ) (0, 1)(0 ,1 )缩放到( − 0.5 , 1.5 ) (-0.5, 1.5)(−0 .5 ,1 .5 )这样网络预测的偏移量就能很方便达到0或1，故最终预测的目标中心点b x , b y b_x, b_y b x ,b y 的计算公式为：
b x = ( 2 ⋅ σ ( t x ) − 0.5 ) + c x b y = ( 2 ⋅ σ ( t y ) − 0.5 ) + c y b_x = (2 \cdot \sigma(t_x) – 0.5) + c_x \ b_y = (2 \cdot \sigma(t_y) – 0.5) + c_y b x =(2 ⋅σ(t x )−0 .5 )+c x b y =(2 ⋅σ(t y )−0 .5 )+c y
下图是我绘制的y = σ ( x ) y = \sigma(x)y =σ(x )对应 before曲线和y = 2 ⋅ σ ( x ) − 0.5 y = 2 \cdot \sigma(x) – 0.5 y =2 ⋅σ(x )−0 .5对应 after曲线，很明显通过引入缩放系数scale以后，y y y对x x x更敏感了，且偏移的范围由原来的( 0 , 1 ) (0, 1)(0 ,1 )调整到了( − 0.5 , 1.5 ) (-0.5, 1.5)(−0 .5 ,1 .5 )。

在YOLOv5中除了调整预测Anchor相对Grid网格左上角( c x , c y ) (c_x, c_y)(c x ,c y )偏移量以外，还调整了预测目标高宽的计算公式，之前是：
b w = p w ⋅ e t w b h = p h ⋅ e t h b_w = p_w \cdot e^{t_w} \ b_h = p_h \cdot e^{t_h}b w =p w ⋅e t w b h =p h ⋅e t h
在YOLOv5调整为：
b w = p w ⋅ ( 2 ⋅ σ ( t w ) ) 2 b h = p h ⋅ ( 2 ⋅ σ ( t h ) ) 2 b_w = p_w \cdot (2 \cdot \sigma(t_w))^2 \ b_h = p_h \cdot (2 \cdot \sigma(t_h))^2 b w =p w ⋅(2 ⋅σ(t w ))2 b h =p h ⋅(2 ⋅σ(t h ))2
作者 Glenn Jocher的原话如下，也可以参考issue #471：

The original yolo/darknet box equations have a serious flaw. Width and Height are completely unbounded as they are simply out=exp(in), which is dangerous, as it can lead to runaway gradients, instabilities, NaN losses and ultimately a complete loss of training.

作者的大致意思是，原来的计算公式并没有对预测目标宽高做限制，这样可能出现梯度爆炸，训练不稳定等问题。下图是修改前y = e x y = e^x y =e x和修改后y = ( 2 ⋅ σ ( x ) ) 2 y = (2 \cdot \sigma(x))^2 y =(2 ⋅σ(x ))2（相对Anchor宽高的倍率因子）的变化曲线，很明显调整后倍率因子被限制在( 0 , 4 ) (0, 4)(0 ,4 )之间。

; 4.4 匹配正样本(Build Targets)

之前在YOLOv4介绍中有讲过该部分内容，其实YOLOv5也差不多。主要的区别在于 GT Box与 Anchor Templates模板的匹配方式。在YOLOv4中是直接将每个 GT Box与对应的 Anchor Templates模板计算 IoU，只要 IoU大于设定的阈值就算匹配成功。但在YOLOv5中，作者先去计算每个 GT Box与对应的 Anchor Templates模板的高宽比例，即：
r w = w g t / w a t r h = h g t / h a t r_w = w_{gt} / w_{at} \ r_h = h_{gt} / h_{at} \r w =w g t /w a t r h =h g t /h a t
然后统计这些比例和它们倒数之间的最大值，这里可以理解成计算 GT Box和 Anchor Templates分别在宽度以及高度方向的最大差异（当相等的时候比例为1，差异最小）：
r w m a x = m a x ( r w , 1 / r w ) r h m a x = m a x ( r h , 1 / r h ) r_w^{max} = max(r_w, 1 / r_w) \ r_h^{max} = max(r_h, 1 / r_h)r w m a x =m a x (r w ,1 /r w )r h m a x =m a x (r h ,1 /r h )
接着统计r w m a x r_w^{max}r w m a x 和r h m a x r_h^{max}r h m a x 之间的最大值，即宽度和高度方向差异最大的值：
r m a x = m a x ( r w m a x , r h m a x ) r^{max} = max(r_w^{max}, r_h^{max})r m a x =m a x (r w m a x ,r h m a x )
如果 GT Box和对应的 Anchor Template的r m a x r^{max}r m a x小于阈值 anchor_t（在源码中默认设置为 4.0），即 GT Box和对应的 Anchor Template的高、宽比例相差不算太大，则将 GT Box分配给该 Anchor Template模板。为了方便大家理解，可以看下我画的图。假设对某个 GT Box而言，其实只要 GT Box满足在某个 Anchor Template宽和高的× 0.25 \times 0.25 ×0 .2 5倍和× 4.0 \times 4.0 ×4 .0倍之间就算匹配成功。

剩下的步骤和YOLOv4中一致：

将 GT投影到对应预测特征层上，根据 GT的中心点定位到对应 Cell，注意图中有三个对应的 Cell。因为网络预测中心点的偏移范围已经调整到了( − 0.5 , 1.5 ) (-0.5, 1.5)(−0 .5 ,1 .5 )，所以按理说只要 Grid Cell左上角点距离 GT中心点在( − 0.5 , 1.5 ) (−0.5,1.5)(−0 .5 ,1 .5 )范围内它们对应的 Anchor都能回归到 GT的位置处。这样会让正样本的数量得到大量的扩充。
则这三个 Cell对应的 AT2和 AT3都为正样本。

还需要注意的是，YOLOv5源码中扩展 Cell时只会往上、下、左、右四个方向扩展，不会往左上、右上、左下、右下方向扩展。下面又给出了一些根据G T x c e n t e r , G T y c e n t e r GT_x^{center}, GT_y^{center}G T x c e n t e r ,G T y c e n t e r 的位置扩展的一些 Cell案例，其中 %1表示取余并保留小数部分。

到此，YOLOv5相关的内容基本上都分析完了。当然由于个人原因，肯定还有一些细节被我忽略掉了，也建议大家自己看看源码，收获肯定会更多。

Original: https://blog.csdn.net/qq_37541097/article/details/123594351
Author: 太阳花的小绿豆
Title: YOLOv5网络详解

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/687998/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

pytorch双线性插值

1、单线性插值化简得：重要公式将y视为像素值的函数； ; 2、双线性插值问题：求P点的像素值？ ; 根据单线性插值公式： 1、得到R1和R2点的像素值： ; 2、然后通过R1和…

人工智能 2023年7月21日
0063
【思维导图】canny滤波原理步骤细致剖析

Canny 算法实现边缘检测，具体步骤如下： 1. 高斯滤波：使用高斯滤波器对图像进行平滑处理，减少噪声对边缘检测的干扰。 2. 计算梯度幅值和方向：对平滑后的图像计算水平…

人工智能 2023年6月22日
00119
Keras CIFAR-10分类自定义simple CNN篇

; Keras CIFAR-10分类自定义simple CNN 文章目录 Keras CIFAR-10分类自定义simple CNN * keras介绍 – ker…

人工智能 2023年7月1日
0065
如何处理过滤算法中的推荐偏差问题

如何处理过滤算法中的推荐偏差问题推荐系统的过滤算法在个性化推荐中起着重要的作用。然而，过滤算法可能存在一些偏差，导致推荐结果倾向于某些特定的项目或类别。这种偏差可能会影响用户的体…

人工智能 2024年1月4日
0041
Yolov5训练指南—CoCo格式数据集

Yolov5训练指南—CoCo格式数据集 1 准备工作 2 将coco数据集转换为yolo数据集 3 训练参数定义 4 训练模型 5 预测 1 准备工作训练Yolo模型要准备的文…

人工智能 2023年6月15日
0086
Kaldi语音识别：基于aidatatang模型实现自制语音数据的识别

aidatatang简介及相关安装、配置等见上一篇文章：Kaldi语音识别：aidatatang_asr开源模型实现中文语音识别详细及遇到的问题【亲自跑通】一、面临的问题用CV…

人工智能 2023年5月27日
0097
MMDetection亲测安装教程

MMDetection是一个基于 PyTorch 的目标检测开源工具箱。接下来就安装看看吧。本人安装环境：系统环境：Ubuntu 20.04.2 LTS cuda版本：11.0…

人工智能 2023年7月5日
0087
[深度学习论文笔记]UNETR: Transformers for 3D Medical Image Segmentation

UNETR: Transformers for 3D Medical Image SegmentationUNETR：用于三维医学图像分割的Transformer Publishe…

人工智能 2023年6月16日
0097
从语音交互历史浅看它是否会是物联网行业的一个爆点？

不看这几篇好文，就别说自己了解物联网背景近几年得益于人工智能在语音领域的突破，语音AI已经趋于成熟，尤其在智能音箱领域，智能音箱又带来了IoT应用到智能家居。本文主要讨论从语…

人工智能 2023年5月25日
0093
mmcv常用API介绍

文章目录前言 1、前置基础知识 * 1.1. 读取图像 1.2. cv2和pil相互转化 1.3. 转成pil进行可视化 1.4. cv2和pil保存图像 2、mmcv * 2….

人工智能 2023年7月19日
0048
Diffusion models代码实战：从零搭建自己的扩散模型

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

人工智能 2023年7月26日
0063
字符图片分割研究小结（搬运、整理、分类、汇总）（自用，持续更新中）

文字图像识别近年来应用广泛包括传统OCR和自然场景下的文字识别图1 印刷文档中的文本图像图2 自然场景中的文本图像常见的文字图像识别应用基本上是遵循下面的流程：字符定位 → …

人工智能 2023年7月2日
0079
目标检测—-YOLOV1

前言目标检测任务的目标是识别图像中物体的类别并且定位物体所在位置用矩形框框出。目标检测领域的深度学习方法的发展主要分为两大类：两阶段（Two-stage）目标检测算法和单阶段（O…

人工智能 2023年7月12日
0077
MATLAB仿真实现图像去噪

摘要数字图像处理是一门新兴技术，随着计算机硬件的发展，其处理能力的不断增强，数字图像的实时处理已经成为可能。由于数字图像处理的各种算法的出现，图像处理学科在飞速发展的同时逐渐向其…

人工智能 2023年7月18日
0066
一文速学-最小二乘法曲线拟合算法详解+项目代码

[ _最小二乘法_非线性曲线参数拟合- _最小二乘法_原理及其MATLAB实现.pdf （初学者–我）最近正在研究matlab _最小二乘法_非线性拟合问题，昨天在论坛…

人工智能 2023年7月4日
0074
【论文笔记_多教师知识蒸馏_2022】CONFIDENCE-AWARE MULTI-TEACHER KNOWLEDGE DISTILLATION

; 摘要知识蒸馏最初是为了利用单个教师模型的额外监督来进行学生模型培训。为了提高学生的表现，最近的一些变体试图利用来自多名教师的不同知识来源。然而，现有的研究主要通过对多个教师预…

人工智能 2023年7月12日
0067

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31