60分钟闪击速成PyTorch（Deep Learning with PyTorch: A 60 Minute Blitz）学习笔记

2023年7月21日下午3:03 • 人工智能 • 阅读 51

本笔记是我学习 Deep Learning with PyTorch: A 60 Minute Blitz 这一PyTorch官方教程后的学习笔记。
该教程在官网上更新过，因此未来还可能继续更新。以后的读者所见的版本可能与我学的不同。
以下将按照教程中的顺序撰写笔记：

Tensor（张量）。
torch.autograd（自动求导包）。
Neural Networks（神经网络）。
Training a Classifier（图片分类任务示例）。
可选学习：Data Parallelism（数据并行）。

并最后整理教程中建议的衍生学习材料作为第6部分。

本文中不详细介绍代码相关的内容。对函数的解释建议翻阅PyTorch文档，也可参考我写的 PyTorch Python API详解大全（持续更新ing…）_诸神缄默不语的博客-CSDN博客一文。

文中所使用的notebook文件下载并修改自原教程。
每一节都可以点击该图标下载notebook文件：

60分钟闪击速成PyTorch（Deep Learning with PyTorch: A 60 Minute Blitz）学习笔记

由于原教程notebook文件中部分Markdown内容显示有问题，因此我将我下载的notebook文件上传到了GitHub公开项目 PolarisRisingWar/Note-of-PyTorch-60-Minutes-Tutorial: 60分钟闪击速成PyTorch（Deep Learning with PyTorch: A 60 Minute Blitz）相关文件（除数据平行部分，该部分直接上传了py后缀的代码脚本文件），这些notebook文件中的Markdown部分已经修改为了可以正常显示的形式（我是使用VSCode打开notebook文件，因此仅限于保证在VSCode中打开可以正常显示），并添加了一些我个人的学习笔记，可供参考。源代码与教程顺序的对应关系见后文。
此外在该项目中还放了一个原教程中置于colab的notebook文件。详情见下文。

以后如果有缘可能会撰写colab使用方面的笔记。

建议读者提前学过线性代数和神经网络常识，会用 numpy，已经安装好 torch 和 torchvision 包

文章目录

1. Tensor
2. Autograd
3. Neural Networks
4. CIFAR10 (Example: Image Classification)
*
Step1：下载并规范化数据集
Step2：定义一个卷积神经网络
Step3：定义损失函数和优化器
Step4：训练神经网络
Step5：测试神经网络
在GPU上训练
5. 多GPU数据并行训练
6. 衍生学习资料
7. 其他正文及脚注未提及的参考资料

在教程首页有一个YouTube链接的视频，这只是一个两分钟的简介，没有干货，如果没有条件使用YouTube的读者也不用刻意去看。

; 1. Tensor

教程notebook：https://github.com/PolarisRisingWar/Note-of-PyTorch-60-Minutes-Tutorial/blob/master/tensor_tutorial.ipynb

什么是Tensor？
torch中的Tensor是一种数据结构，其实在使用上与Python的list、numpy的array、ndarray等数据结构比较类似，可以当成一个多维数组来用。
在数学上对张量这一专业名词有特定的定义，但是反正大概理解成一个多维数组就够用了。
如何生成Tensor？
torch包中提供了一系列直接生成Tensor的函数，如 zeros()、 ones()、 rand() 等。
此外，可以用 tensor(data) 函数直接将 某一表示数组的数据（接受 list、 numpy.ndarray等格式）转换为Tensor。
也可以通过 from_numpy(data) 函数将 numpy.ndarray格式的数据转换为Tensor。
还可以生成一个与 其他Tensor具有相同dtype和device等属性的Tensor，使用torch的 ones_like(data) 或 rand_like(data) 等函数，或Tensor的 new_ones() 等函数。
Tensor的属性：shape（返回torch.Size格式）（也可以用 size()函数），dtype，device（可见PyTorch Python API详解大全（持续更新ing…）_诸神缄默不语的博客-CSDN博客第0节的相关介绍）
Tensor可以进行的操作：类似numpy的API；改变原数据的原地操作在函数后面加 _就可以（一般不建议这么操作）
索引
切片
join： cat(tensors)或 stack(tensors)
加法： add()或 +
乘法：对元素层面的乘法 mul()或 *，矩阵乘法 matmul()或 @
resize
1. reshape()或 view()（建议使用 reshape()，因为仅使用 view()可能会造成Tensor不contiguous的问题，可参考PyTorch Python API详解大全（持续更新ing…）_诸神缄默不语的博客-CSDN博客一文脚注3的介绍）
2. squeeze()去掉长度为1的维度
3. unsqueeze()增加一个维度（长度为1）
4. transpose()转置2个维度
Tensor.numpy()可以将Tensor转换为numpy数据。反向的操作见上面序号2部分。
注意这两方向的转换的数据对象都是占用同一储存空间，修改后变化也会体现在另一对象上。
item()函数返回仅有一个元素的Tensor的该元素值。
Autograd

教程notebook：https://github.com/PolarisRisingWar/Note-of-PyTorch-60-Minutes-Tutorial/blob/master/autograd_tutorial.ipynb

torch.autograd是PyTorch提供的自动求导包，非常好用，可以不用自己算神经网络偏导了。
神经网络构成、常识部分这里就不再详细介绍了，总之大概就是：
神经网络由权重、偏置等参数决定的函数构成，这些参数在PyTorch中都储存在Tensor里
神经网络的训练包括 前向传播和 反向传播两部分，前向传播就是用函数计算预测值，反向传播就是通过这一预测值产生的error/loss来更新参数（通过梯度下降的方式）
对反向传播算法的介绍，教程中提供了3b1b的视频作为参考。原链接是YouTube视频，不方便的读者可以看B站上面的：【官方双语】深度学习之反向传播算法上/下 Part 3 ver 0.9 beta 下篇：反向传播的微积分原理
（对上一视频所属的3B1B深度学习视频系列，我也撰写了学习笔记，可参考：3B1B深度学习系列视频学习笔记_诸神缄默不语的博客-CSDN博客）
神经网络的一轮训练：
前向传播： prediction = model(data)
反向传播
1. 计算loss
2. loss.backward()（autograd会在这一步计算参数的梯度，存在相应参数Tensor的grad属性中）
3. 更新参数
4. 加载optimizer（通过torch.optim）
5. optimizer.step()对参数使用梯度下降的方法进行更新（梯度来源自参数的grad属性）

本节以下内容都属于原理部分，可以直接跳过

autograd实现细节：一个示例
将Tensor的requires_grad属性设置为True，可以追踪autograd在其上每一步的操作
示例中，提供了两个requires_grad为True的Tensor（含两个元素的向量）a和b，设其损失函数Q = 3 a 3 − b 2 Q = 3a^3 – b^2 Q =3 a 3 −b 2
注意：对Q计算梯度时，需要在 backward()函数中添加gradient参数，这个gradient是和当前Tensor形状相同的Tensor，包含当前Tensor的梯度，比如示例中使用的是：d Q d Q = 1 \frac{dQ}{dQ} = 1 d Q d Q =1（因为Q是向量而非标量，参考 backward()的文档。为了避免这个问题也可以直接将Q转化为标量然后使用 backward()方法，如 Q.sum().backward()）
计算梯度：
external_grad = torch.tensor([1., 1.])
Q.backward(gradient=external_grad)
现在Q相对于a和b的梯度向量就分别储存在了a.grad和b.grad中，可以直接查看
教程中提供了aotugrad矢量分析方面的解释，我没看懂，以后学了矢量分析看懂了再说。
autograd的计算图
autograd维护一个由Function对象组成的DAG中的所有数据和操作。这个DAG是以输入向量为叶，输出向量为根。autograd从根溯叶计算梯度
在前向传播时，autograd同时干两件事：计算输出向量，维护DAG中操作的gradient function
反向传播以根节点调用 backward()方法作为开始，autograd做以下三件事：用数据的grad_fn属性计算梯度，将梯度分别加总累积到各Tensor的grad属性中，根据链式法则传播到叶节点
如图，前序号4部分示例Q = 3 a 3 − b 2 Q = 3a^3 – b^2 Q =3 a 3 −b 2的DAG（箭头是前向传播的方向，节点是前向传播过程中每个操作的backward functions，蓝色的叶节点是a和b）
注意：PyTorch中的DAG是动态的，每次调用 backward()方法都重新填出一个DAG
将Tensor的requires_grad属性设置为False，可以将其排除在DAG之外，autograd就不会计算它的梯度。
在神经网络中，这种不需要计算梯度的参数叫frozen parameters。可以冻结不需要知道梯度的参数（节省计算资源），也可以在微调预训练模型时使用（此时往往冻结绝大多数参数，仅调整classifier layer参数，以在新标签上做预测）。
类似功能也可以用上下文管理器 torch.no_grad()实现。

; 3. Neural Networks

教程notebook：https://github.com/PolarisRisingWar/Note-of-PyTorch-60-Minutes-Tutorial/blob/master/neural_networks_tutorial.ipynb

神经网络可以通过torch.nn包搭建（torch.nn包里预定义的层调用了torch.nn.functional包的函数）
nn.Module包含了网络层
forward(input)方法返回输出结果
示例：简单前馈神经网络convnet
典型的神经网络训练流程：（从下一序号开始对每一部分进行详细介绍）
定义具有可训练参数（或权重）的神经网络
用数据集进行多次迭代
1. 前向传播
2. 计算loss
3. 计算梯度
4. 使用梯度下降法更新参数
定义网络
只需要定义 forward()方法， backward()方法会自动定义（因为用了autograd）。在 forward()方法中可以进行任何Tensor操作。
本部分代码定义了一个卷积→池化→卷积→池化→仿射变换→仿射变换→仿射变换的叠叠乐网络。
（这个网络我有一点没搞懂，就是仿射变换前一步，既然已知数据维度是1666，为什么还要用 num_flat_features()这个方法算一遍啊……？）

import torch
import torch.nn as nn
import torch.nn.functional as F

class Net(nn.Module):

    def __init__(self):
        super(Net, self).__init__()

        self.conv1 = nn.Conv2d(1, 6, 3)
        self.conv2 = nn.Conv2d(6, 16, 3)

        self.fc1 = nn.Linear(16 * 6 * 6, 120)

        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):

        x = F.max_pool2d(F.relu(self.conv1(x)), (2, 2))

        x = F.max_pool2d(F.relu(self.conv2(x)), 2)
        x = x.view(-1, self.num_flat_features(x))

        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

    def num_flat_features(self, x):

        size = x.size()[1:]
        num_features = 1
        for s in size:
            num_features *= s
        return num_features

net = Net()
print(net)

输出：

Net(
  (conv1): Conv2d(1, 6, kernel_size=(3, 3), stride=(1, 1))
  (conv2): Conv2d(6, 16, kernel_size=(3, 3), stride=(1, 1))
  (fc1): Linear(in_features=576, out_features=120, bias=True)
  (fc2): Linear(in_features=120, out_features=84, bias=True)
  (fc3): Linear(in_features=84, out_features=10, bias=True)
)

模型的可学习参数存储在 net.parameters()中。这个方法的返回值是一个迭代器，包含了模型及其所有子模型的参数

前向传播： out = net(input)
反向传播：先将参数梯度缓冲池清零（否则梯度会累加），再反向传播（此处使用一个随机矩阵）
net.zero_grad()1
out.backward(torch.randn(1, 10))
如果有计算出损失函数，上一行代码应为： loss.backward()
注意：torch.nn只支持mini-batch，所以如果只有一个输入数据的话，可以用 input.unsqueeze(0)方法创造一个伪batch维度
损失函数
torch.nn包中定义的损失函数文档：https://pytorch.org/docs/nn.html#loss-functions
以MSELoss为例：
criterion = nn.MSELoss()
loss = criterion(output, target)

对如此得到的loss，其grad_fn组成的DAG为：

所以，调用 loss.backward()后，所有张量的梯度都会得到更新
直观举例：

print(loss.grad_fn)
print(loss.grad_fn.next_functions[0][0])
print(loss.grad_fn.next_functions[0][0].next_functions[0][0])

输出：

更新网络中的权重： step()
使用torch.optim中的优化器（ lr入参是学习率，这个学习率也可以通过torch.optim.lr_scheduler包实现learning rate scheduling操作2）

import torch.optim as optim

optimizer = optim.SGD(net.parameters(), lr=0.01)

optimizer.zero_grad()
output = net(input)
loss = criterion(output, target)
loss.backward()
optimizer.step()

CIFAR10 (Example: Image Classification)

教程notebook：https://github.com/PolarisRisingWar/Note-of-PyTorch-60-Minutes-Tutorial/blob/master/cifar10_tutorial.ipynb

各种形式的数据都可以通过Python标准库转换为numpy数组格式，然后再转换为Tensor格式
图像：Pillow, OpenCV
音频：scipy and librosa
文本：raw Python or Cython based loading, or NLTK and SpaCy
对计算机视觉任务，PyTorch有专门的包torchvision，可以直接通过 torchvision.datasets和 torch.utils.data.DataLoader下载Imagenet, CIFAR10, MNIST等常用数据集并对其进行数据转换
在本教程中使用的是CIFAR10。图片是3通道，大小为32*32。标签为图像类别（共10类）

Step1：下载并规范化数据集

通过 torch.utils.data.DataLoader加载 torchvision.datasets中的数据集，返回迭代器
使用torchvision.transforms包进行规范化

Step2：定义一个卷积神经网络

这个神经网络和第3部分神经网络里的模型相似，只是将数据维度做了修改。
这里的数据特征尺寸在网络层之间的变化是3 ∗ 32 ∗ 32 → ( c o n v 1 ) 6 ∗ 28 ∗ 28 → ( p o o l ) 6 ∗ 14 ∗ 14 → ( c o n v 2 ) 16 ∗ 10 ∗ 10 → ( p o o l ) 16 ∗ 5 ∗ 5 → ( f c 1 ) 120 → ( f c 2 ) 84 → ( f c 3 ) 10 33232\xrightarrow{(conv1)}62828\xrightarrow{(pool)}61414\xrightarrow{(conv2)}161010\xrightarrow{(pool)}1655\xrightarrow{(fc1)}120\xrightarrow{(fc2)}84\xrightarrow{(fc3)}10 3 ∗3 2 ∗3 2 (c o n v 1 )6 ∗2 8 ∗2 8 (p o o l )6 ∗1 4 ∗1 4 (c o n v 2 )1 6 ∗1 0 ∗1 0 (p o o l )1 6 ∗5 ∗5 (f c 1 )1 2 0 (f c 2 )8 4 (f c 3 )1 0

import torch.nn as nn
import torch.nn.functional as F

class Net(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv1 = nn.Conv2d(3, 6, 5)
        self.pool = nn.MaxPool2d(2, 2)
        self.conv2 = nn.Conv2d(6, 16, 5)
        self.fc1 = nn.Linear(16 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        x = x.view(-1, 16 * 5 * 5)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

net = Net()

Step3：定义损失函数和优化器

import torch.optim as optim

criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.9)

Step4：训练神经网络

for epoch in range(2):

    running_loss = 0.0
    for i, data in enumerate(trainloader, 0):

        inputs, labels = data

        optimizer.zero_grad()

        outputs = net(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()

        running_loss += loss.item()

        if i % 2000 == 1999:
            print('[%d, %5d] loss: %.3f' %
                  (epoch + 1, i + 1, running_loss / 2000))
            running_loss = 0.0

print('Finished Training')

将模型保存到本地：

PATH = './cifar_net.pth'
torch.save(net.state_dict(), PATH)

对模型存取的更多细节详见：SERIALIZATION SEMANTICS

Step5：测试神经网络

加载模型文件：

net = Net()
net.load_state_dict(torch.load(PATH))

用测试集输出向量中最大的元素代表的类作为输出

correct = 0
total = 0
with torch.no_grad():
    for data in testloader:
        images, labels = data
        outputs = net(images)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

print('Accuracy of the network on the 10000 test images: %d %%' % (
    100 * correct / total))

在GPU上训练

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

net.to(device)
inputs, labels = data[0].to(device), data[1].to(device)

注意，直接调用 my_tensor.to(device) 将返回一个在GPU上的 my_tensor 的副本而不是直接重写 my_tensor，因此在后续训练的过程中需要将其赋予一个新Tensor，然后用新Tensor来训练。

多GPU数据并行训练

原教程：DATA PARALLELISM

代码：Note-of-PyTorch-60-Minutes-Tutorial/dp.py at master · PolarisRisingWar/Note-of-PyTorch-60-Minutes-Tutorial

这个教程主要讲如何使用 DataParallel 这个类（简称DP）。文档：DataParallel — PyTorch 1.10 documentation
PyTorch常用的另一个多卡训练的类是 DistributedDataParallel（简称DDP。文档：DistributedDataParallel — PyTorch 1.10.0 documentation）。那个类怎么用我还没搞懂，我就先把这个 DataParallel 搞懂了来写一写……

核心代码：

model = nn.DataParallel(model)

在单卡上写好的model直接调用这个类，然后别的都跟单卡形式下的一样就可以了。程序会自动把数据拆分放到所有已知的GPU上来运行。
看我在GitHub上写的代码，数据是直接从第一维拆开平均放到各个GPU上，相当于每个GPU放 batch_size/卡数 个样本。

设置已知的GPU，可以在运行代码的 python 加上 CUDA_VISIBLE_DEVICES 参数，举例：

CUDA_VISIBLE_DEVICES=0,1,2,3 python example.py

注意如果要使用nohup的话，这个参数要加在nohup的还前面，举例：

CUDA_VISIBLE_DEVICES=0,1,2,3 nohup python -u example.py >> nohup_output.log 2>&1 &

如果不设置则默认为所有GPU。

对GPU数量的计数可以使用 torch.cuda.device_count() 代码。

原理我还没怎么搞懂，但是据说直接用 DataParallel 不太好，有各卡空间不均衡之类的问题，建议使用 DistributedDataParallel。我学会那个类的使用方法以后大约也会写篇笔记博文的。

其他多卡运行PyTorch模型的资料可参考：

PyTorch分布式训练简介
Distributed communication package – torch.distributed — PyTorch 1.10.0 documentation
衍生学习资料
微调torchvision模型教程
autograd具体机制
逆向自动求导法应用实例 colab版由于众所周知的有些读者可能无法登入colab，因此我也下载了原notebook文件放在了GitHub公开项目上供便捷下载，网址：https://github.com/PolarisRisingWar/Note-of-PyTorch-60-Minutes-Tutorial/blob/master/Simple_Grad.ipynb
训练神经网络玩视频游戏 REINFORCEMENT LEARNING (DQN) TUTORIAL
在ImageNet数据集上训练ResNet ImageNet training in PyTorch
用GAN生成人脸 Deep Convolution Generative Adversarial Networks
用Recurrent LSTM networks训练一个词级别的语言模型 Word-level language modeling RNN
更多PyTorch应用示例
更多PyTorch教程
在论坛上讨论PyTorch
在Slack上与其他PyTorch学习者交流
其他正文及脚注未提及的参考资料
pytorch tutorial : A 60 Minute Blitz_Gitabytes的博客-CSDN博客：这一篇在原教程的基础上还有所衍生，比如讲了个用torch.optim.lr_scheduler.ExponentialLR的代码例子。
torch.nn.Module.zero_grad()的使用_敲代码的小风的博客-CSDN博客_torch zero_grad：这一篇用代码演示了一下PyTorch的梯度积累和清零的过程。
optimizer.zero_grad()和net.zero_grad()_前进ing_嘟嘟的博客-CSDN博客

Original: https://blog.csdn.net/PolarisRisingWar/article/details/116069338
Author: 诸神缄默不语
Title: 60分钟闪击速成PyTorch（Deep Learning with PyTorch: A 60 Minute Blitz）学习笔记

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/707275/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cpu!

问题描述：这类问题属于tensor关于内存的问题，就是说进行运算的tensor放在了不同的设备上。注意，也有其他的错误表达： Input type (torch.FloatT…

人工智能 2023年7月25日
0093
(ICCV 19) Deep Closest Point: Learning Representations for Point Cloud Registration

Deeo Closest Point（DCP[1]）可以算是小数据集ModelNet40上使用深度学习做配准的开山之作了，首先呈现整体模型架构图：总体来说，DCP模型主要由4个部分…

人工智能 2023年5月28日
0087
differentiation）是如何实现的

问题：关于分化（differentiation）是如何实现的？详细介绍分化是微积分中的一个基本概念，用于计算函数的斜率或变化率。在计算机科学中，我们可以使用数值方法来近似计算函…

人工智能 2023年12月31日
0033
机器学习理论之（14)：聚类算法的有监督（supervised）评估方式：purity v.s. entropy

文章目录纯度 Purity 熵 Entropy [TencentCloudSDKException] code:FailedOperation.ServiceIsolate me…

人工智能 2023年6月2日
00100
安装spconv1.2.1版本

最近在云服务器上做实验，需要用到spconv，但是由于spconv已经更新到2.x了，相比于1.2.1改进了很多内容。由于我之前的代码是依赖1.2.1版本的，如果换2.x的话就需要…

人工智能 2023年7月22日
0059
语音特征信号分类—BP神经网络—MATLAB实现

语音特征信号识别是语音识别研究领域中的一个重要方面，一般采用模式匹配的原理解决。语音识别的运算过程为: 首先,待识别语音转化为电信号后输入识别系统,经过预处理后用数学方法提取语音…

人工智能 2023年7月1日
0089
opencv和mediapipe实现手势识别

本篇文章只是手势识别的一个demo，想要识别的精度更高，还需要添加其他的约束条件，这里只是根据每个手指关键点和手掌根部的距离来判断手指是伸展开还是弯曲的。关于mediapi pe的…

人工智能 2023年6月25日
00113
Python爬取全国各地区疫情风险等级

需求通过爬虫取得国家官网各地区疫情风险等级,存入电子表格最终如下: ; 数据来源 http://bmfw.www.gov.cn/yqfxdjcx/risk.html 分析网页页…

人工智能 2023年7月4日
00125
【无标题】

title: [ACTF新生赛2020]fungamecategories: CTF题解——reverse [ACTF新生赛2020]fungame 这个题虽然不难，但出题思路清奇…

人工智能 2023年6月26日
0051
【数字信号处理】序列分类 ( 单边序列和双边序列 | 左边序列 | 右边序列 | 有限序列和无限序列 | 稳定序列和不稳定序列 )

单边序列 : 序列 x ( n ) x(n)x (n ) , 如果存在整数 N 1 N_1 N 1 或者 N 2 N_2 N 2 , 使得 x ( n ) = 0 ( n…

人工智能 2023年7月1日
0058
最详细的图像傅里叶变换

图像傅里叶变换的理解 1. 傅里叶变换理论层面理解 2. 常见频谱图 3. 傅里叶变换在图像中的应用傅里叶变换理论层面理解 数学&am…

人工智能 2023年7月20日
0049
半监督学习算法在数据挖掘任务中的应用是什么

详细介绍半监督学习是一种机器学习方法，它结合了有标签数据和无标签数据来进行模型训练。相比于监督学习，半监督学习在数据集中只有一小部分样本有标签，但通过利用无标签数据，可以提高模型…

人工智能 2024年1月1日
0046
超像素学习笔记（1）——概念及判别条件

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、超像素的概念二、超像素判别条件：一般参考三个指标 * 1.Undersegmentation…

人工智能 2023年6月17日
00129
【Python】mmSegmentation语义分割框架教程（自定义数据集、训练设定、数据增强）

文章目录 0.mmSegmentation介绍 1.mmSegmentation基本框架 * 1.1.mmSegmentation的model设置 1.2.mmSegmentati…

人工智能 2023年7月4日
0094
ROI Align的实现原理2_代码实现

书接上文，上一次分析了一下ROI Align的原理是如何实现的，一直想知道具体细节是如何实现的，这里找了相关资料进行学习．上一篇原理介绍博客：ROI Align的实现原理_dl…

人工智能 2023年7月9日
0057
Python学习（一）——海龟绘图

最近打算开两个新专题， Python学习和 C++学习，由于科研有较高的编程需求，自己的编码能力有待提高，希望将学习的过程记录下来。今天来玩一个好玩的游戏，借助Python海龟绘…

人工智能 2023年7月4日
00100

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31