&#x8FD9;&#x4E2A;&#x662F;&#x7528;&#x6765;&#x751F;&#x6210;&#x4E00;&#x4E2A;&#x4E3A;&#x672A;&#x521D;&#x59CB;&#x5316;&#x7684;5*3&#x7684;&#x5F20;&#x91CF;&#xFF0C;&#x5207;&#x8BB0;&#x4E0D;&#x662F;&#x5168;&#x96F6;
x = torch.empty(5, 3

随机化0-1张量

&#x8FD9;&#x4E2A;&#x662F;&#x751F;&#x6210;&#x4E00;&#x4E2A;&#x5747;&#x5300;&#x5206;&#x5E03;&#x7684;&#x521D;&#x59CB;&#x5316;&#x7684;&#xFF0C;&#x6BCF;&#x4E2A;&#x5143;&#x7D20;&#x4ECE;0~1&#x7684;&#x5F20;&#x91CF;&#xFF0C;&#x4E0E;&#x7B2C;&#x4E00;&#x4E2A;&#x8981;&#x533A;&#x522B;&#x5F00;&#xFF0C;&#x53E6;&#x5916;&#xFF0C;&#x8FD8;&#x6709;&#x5176;&#x5B83;&#x7684;&#x968F;&#x673A;&#x5F20;&#x91CF;&#x751F;&#x6210;&#x51FD;&#x6570;&#xFF0C;&#x5982;torch.randn()&#x3001;torch.normal()&#x3001;torch.linespace()&#xFF0C;&#x5206;&#x522B;&#x662F;&#x6807;&#x51C6;&#x6B63;&#x6001;&#x5206;&#x5E03;&#xFF0C;&#x79BB;&#x6563;&#x6B63;&#x6001;&#x5206;&#x5E03;&#xFF0C;&#x7EBF;&#x6027;&#x95F4;&#x8DDD;&#x5411;&#x91CF;
x = torch.rand(5, 3)

全0张量

&#x8FD9;&#x4E2A;&#x662F;&#x521D;&#x59CB;&#x5316;&#x4E00;&#x4E2A;&#x5168;&#x96F6;&#x5F20;&#x91CF;&#xFF0C;&#x53EF;&#x4EE5;&#x6307;&#x5B9A;&#x6BCF;&#x4E2A;&#x5143;&#x7D20;&#x7684;&#x7C7B;&#x578B;&#x3002;
x = torch.zeros(5, 3, dtype=torch.long)

已有矩阵转化为张量

x = torch.tensor([5.5, 3])

size函数来看它的shape

print(x.size())

张量加法

print(torch.add(x, y))

张量的大小

print(x.item())

torch转numpy

在使用Cpu的情况下，张量和array将共享他们的物理位置，改变其中一个的值，另一个也会随之变化。

a = torch.ones(5)
b = a.numpy()

numpy转torch

a = np.ones(5)
b = torch.from_numpy(a)

GPU下转化

if torch.cuda.is_available():
    device = torch.device("cuda")          # a CUDA device object
    y = torch.ones_like(x, device=device)  # directly create a tensor on GPU
    x = x.to(device)                       # or just use strings .to("cuda")
    z = x + y

2 自动微分

在pytorch中，神经网络的核心是自动微分

2.1 Tensor类

orch.Tensor 是这个包的核心类。如果它的属性requires_grad是True，那么PyTorch就会追踪所有与之相关的operation。当完成(正向)计算之后，我们可以调用backward()，PyTorch会自动的把所有的梯度都计算好。与这个tensor相关的梯度都会累加到它的grad属性里。

如果不想计算这个tensor的梯度，我们可以调用detach()，这样它就不会参与梯度的计算了。为了阻止PyTorch记录用于梯度计算相关的信息(从而节约内存)，我们可以使用 with torch.no_grad()。这在模型的预测时非常有用，因为预测的时候我们不需要计算梯度，否则我们就得一个个的修改Tensor的requires_grad属性，这会非常麻烦。

关于autograd的实现还有一个很重要的Function类。Tensor和Function相互连接从而形成一个有向无环图, 这个图记录了计算的完整历史。每个tensor有一个grad_fn属性来引用创建这个tensor的Function(用户直接创建的Tensor，这些Tensor的grad_fn是None)。

如果你想计算梯度，可以对一个Tensor调用它的backward()方法。如果这个Tensor是一个scalar(只有一个数)，那么调用时不需要传任何参数。如果Tensor多于一个数，那么需要传入和它的shape一样的参数，表示反向传播过来的梯度。

创建tensor时设置属性requires_grad=True，PyTorch就会记录用于反向梯度计算的信息：

    x = torch.ones(2, 2, requires_grad=True)
    print(x)

然后我们通过operation产生新的tensor：

y = x + 2
print(y)

是通过operation产生的tensor，因此它的grad_fn不是None。

    print(y.grad_fn)
    #

再通过y得到z和out

    z = y * y * 3
    out = z.mean()

    print(z, out)
    # z = tensor([[ 27.,  27.],[ 27.,  27.]])
    # out = tensor(27.)

requires_grad_()函数会修改一个Tensor的requires_grad。

a = torch.randn(2, 2)
a = ((a * 3) / (a - 1))
print(a.requires_grad)
a.requires_grad_(True)
print(a.requires_grad)
b = (a * a).sum()
print(b.grad_fn)
输出：
    False
    True

2.2 梯度

现在我们里反向计算梯度。因为out是一个scalar，因此out.backward()等价于out.backward(torch.tensor(1))。

v = torch.tensor([0.1, 1.0, 0.0001], dtype=torch.float)
y.backward(v)

print(x.grad) #数量的梯度，即各个方向的导数的集合
"""
tensor([1.0240e+02, 1.0240e+03, 1.0240e-01])
"""
#停止计算微分
print(x.requires_grad)
print((x ** 2).requires_grad)

with torch.no_grad():
   print((x ** 2).requires_grad)
"""
True
True
False
"""

3 神经网络

神经网络定义过程

定义神经网络及其参数；
在数据集上多次迭代循环；
通过神经网络处理数据集；
计算损失（输出和正确的结果之间相差的距离）；
用梯度对参数反向影响；
更新神经网络的权重，weight = weight – rate * gradient；

3.1 定义网络

import torch
import torch.nn as nn
import torch.nn.functional as F

汉字均为我个人理解，英文为原文标注。
class Net(nn.Module):

 #1、初始化定义
  def __init__(self):
        # 继承原有模型
        super(Net, self).__init__()
        # 1 input image channel, 6 output channels, 5x5 square convolution
        # kernel
        # 定义了两个卷积层
        # 第一层是输入1维的（说明是单通道，灰色的图片）图片，输出6维的的卷积层（说明用到了6个卷积核，而每个卷积核是5*5的）。
        self.conv1 = nn.Conv2d(1, 6, 5)
        # 第一层是输入1维的（说明是单通道，灰色的图片）图片，输出6维的的卷积层（说明用到了6个卷积核，而每个卷积核是5*5的）。
        self.conv2 = nn.Conv2d(6, 16, 5)
        # an affine operation: y = Wx + b
        # 定义了三个全连接层，即fc1与conv2相连，将16张5*5的卷积网络一维化，并输出120个节点。
        self.fc1 = nn.Linear(16 * 5 * 5, 120)
        # 将120个节点转化为84个。
        self.fc2 = nn.Linear(120, 84)
        # 将84个节点输出为10个，即有10个分类结果。
        self.fc3 = nn.Linear(84, 10)

 #2、搭建网络   我们只需要定义forward函数，而backward函数会自动通过autograd创建。
    def forward(self, x):
        # Max pooling over a (2, 2) window
        # 用relu激活函数作为一个池化层，池化的窗口大小是2*2，这个也与上文的16*5*5的计算结果相符（一开始我没弄懂为什么fc1的输入点数是16*5*5,后来发现，这个例子是建立在lenet5上的）。
        # 这句整体的意思是，先用conv1卷积，然后激活，激活的窗口是2*2。
        x = F.max_pool2d(F.relu(self.conv1(x)), (2, 2))
        # If the size is a square you can only specify a single number
        # 作用同上，然后有个需要注意的地方是在窗口是正方形的时候，2的写法等同于（2，2）。
        # 这句整体的意思是，先用conv2卷积，然后激活，激活的窗口是2*2。
        x = F.max_pool2d(F.relu(self.conv2(x)), 2)
        # 实际上view（）类似于reshape（）的用法，将张量重新规划格式 -1代表待定
        x = x.view(-1, self.num_flat_features(x)) #一维化
        # 用一下全连接层fc1，然后做一个激活。
        x = F.relu(self.fc1(x))
        # 用一下全连接层fc2，然后做一个激活。
        x = F.relu(self.fc2(x))
        # 用一下全连接层fc3。
        x = self.fc3(x)
        return x

    def num_flat_features(self, x):
        # 承接上文的引用，这里需要注意的是，由于pytorch只接受图片集的输入方式（原文的单词是batch）,所以第一个代表个数的维度被忽略。
        size = x.size()[1:]  # all dimensions except the batch dimension
        num_features = 1
        for s in size:
            num_features *= s
        return num_features

net = Net()
print(net)

"""
Net(
  (conv1): Conv2d(1, 6, kernel_size=(5, 5), stride=(1, 1))
  (conv2): Conv2d(6, 16, kernel_size=(5, 5), stride=(1, 1))
  (fc1): Linear(in_features=400, out_features=120, bias=True)
  (fc2): Linear(in_features=120, out_features=84, bias=True)
  (fc3): Linear(in_features=84, out_features=10, bias=True)
)
"""

3.2 查看模型参数

现在我们已经构建好模型了，但是还没有开始用bp呢，如果你对前面的内容有一些印象的话，你就会想起来不需要我们自己去搭建，我们只需要用某一个属性就可以了，autograd。

现在我们需要来看一看我们的模型，下列语句可以帮助你看一下这个模型的一些具体情况。

params = list(net.parameters())
print(len(params))
print(params[0].size())  # conv1's .weight

"""
10
torch.Size([6, 1, 5, 5])
"""

3.3 测试网络

input = torch.randn(1, 1, 32, 32)
out = net(input)
print(out)
tensor([[-0.0198,  0.0438,  0.0930, -0.0267, -0.0344,  0.0330,  0.0664,
0.1244, -0.0379,  0.0890]])

#默认的梯度会累加，因此我们通常在backward之前清除掉之前的梯度值：
net.zero_grad()
out.backward(torch.randn(1, 10))

3.4 损失函数更新权重

1、计算损失
这一部分是来搞定损失函数
output = net(input)
target = torch.randn(10)  # a dummy target, for example
target = target.view(1, -1)  # make it the same shape as output
criterion = nn.MSELoss()
loss = criterion(output, target)
print(loss)

2、查看结果
print(loss.grad_fn)  # MSELoss
print(loss.grad_fn.next_functions[0][0])  # Linear
print(loss.grad_fn.next_functions[0][0].next_functions[0][0])  # ReLU

3、计算梯度
#在调用loss.backward()之前，我们需要清除掉tensor里之前的梯度，否则会累加进去。
net.zero_grad()
loss.backward()

4、更新权重 （梯度下降）
learning_rate = 0.01
for f in net.parameters():
   f.data.sub_(f.grad.data * learning_rate)

使用优化包即使用optimizer，我们也需要清零梯度。但是我们不需要一个个的清除，而是用optimizer.zero_grad()一次清除所有。

import torch.optim as optim

创建optimizer，需要传入参数和learning rate
optimizer = optim.SGD(net.parameters(), lr=0.01)

清除梯度
optimizer.zero_grad()
output = net(input)
loss = criterion(output, target)
loss.backward()
optimizer.step()    # optimizer会自动帮我们更新参数

4 训练分类器

4.1 数据处理生成Dataload

特别是对于视觉领域，我们写了一个叫做torchvision的包，他可以将很多知名数据的数据即涵盖在内。并且，通过torchvision.datasets 和 torch.utils.data.DataLoader 进行数据的转化。在本里中我们将会使用 CIFAR10 数据集，它有以下各类： ‘airplane’, ‘automobile’, ‘bird’, ‘cat’, ‘deer’, ‘dog’, ‘frog’, ‘horse’, ‘ship’, ‘truck’。在这个数据集中的图像尺寸都是33232的。

import torch
import torchvision
import torchvision.transforms as transforms

#数据归一化
transform = transforms.Compose(
    [transforms.ToTensor(),
transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])
#训练集
trainset = torchvision.datasets.CIFAR10(root='/path/to/data', train=True,
    download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=4,
    shuffle=True, num_workers=2)
#测试集
testset = torchvision.datasets.CIFAR10(root='/path/to/data', train=False,
    download=True, transform=transform)
testloader = torch.utils.data.DataLoader(testset, batch_size=4,
    shuffle=False, num_workers=2)
标签
classes = ('plane', 'car', 'bird', 'cat',
    'deer', 'dog', 'frog', 'horse', 'ship', 'truck')

4.2 定义卷积网络

import torch.nn as nn
import torch.nn.functional as F
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(3, 6, 5)
        self.pool = nn.MaxPool2d(2, 2)
        self.conv2 = nn.Conv2d(6, 16, 5)
        self.fc1 = nn.Linear(16 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        x = x.view(-1, 16 * 5 * 5)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x
net = Net()

4.3 定义损失函数

import torch.optim as optim
#这里使用交叉熵损失函数，Optimizer使用带冲量的SGD。
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.9)

4.4 遍历DataLoader进行训练

for epoch in range(2):  # 这里只迭代2个epoch，实际应该进行更多次训练

    running_loss = 0.0
    #enumerate将其组成一个索引序列，利用它可以同时获得索引和值
    for i, data in enumerate(trainloader, 0):
        # 得到输入
        inputs, labels = data

        # 梯度清零
        optimizer.zero_grad()

        # forward + backward + optimize
        outputs = net(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()

        # 定义统计信息
        running_loss += loss.item()
        if i % 2000 == 1999:
            print('[%d, %5d] loss: %.3f' %
                (epoch + 1, i + 1, running_loss / 2000))
        running_loss = 0.0

print('Finished Training')

4.5 测试

取样测试

#next() 返回迭代器的下一个项目。
#next() 函数要和生成迭代器的iter() 函数一起使用。

1 选取图片
dataiter = iter(testloader)
images, labels = dataiter.next()
imshow(torchvision.utils.make_grid(images))
print('GroundTruth: ', ' '.join('%5s' % classes[labels[j]] for j in range(4)))
2 预测结果
outputs = net(images)
_, predicted = torch.max(outputs, 1)
print('Predicted: ', ' '.join('%5s' % classes[predicted[j]]
        for j in range(4)))

测试集一类测试

correct = 0
total = 0
with torch.no_grad():
for data in testloader:
    images, labels = data
    outputs = net(images)
    _, predicted = torch.max(outputs.data, 1)
    total += labels.size(0)
    correct += (predicted == labels).sum().item()

print('Accuracy of the network on the 10000 test images: %d %%' % (
    100 * correct / total))

每类的测试

class_correct = list(0. for i in range(10))
class_total = list(0. for i in range(10))
with torch.no_grad():
    for data in testloader:
        images, labels = data
        outputs = net(images)
        _, predicted = torch.max(outputs, 1)
        c = (predicted == labels).squeeze()
        for i in range(4):
            label = labels[i]
            class_correct[label] += c[i].item()
            class_total[label] += 1

for i in range(10):
    print('Accuracy of %5s : %2d %%' % (
        classes[i], 100 * class_correct[i] / class_total[i]))

Accuracy of plane : 52 %
Accuracy of   car : 66 %
Accuracy of  bird : 49 %
Accuracy of   cat : 34 %
Accuracy of  deer : 30 %
Accuracy of   dog : 45 %
Accuracy of  frog : 72 %
Accuracy of horse : 71 %
Accuracy of  ship : 76 %
Accuracy of truck : 55 %

5 GPU训练

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
print(device)
cuda:0
class Net2(nn.Module):
def __init__(self):
super(Net2, self).__init__()
self.conv1 = nn.Conv2d(3, 6, 5).to(device)
self.pool = nn.MaxPool2d(2, 2).to(device)
self.conv2 = nn.Conv2d(6, 16, 5).to(device)
self.fc1 = nn.Linear(16 * 5 * 5, 120).to(device)
self.fc2 = nn.Linear(120, 84).to(device)
self.fc3 = nn.Linear(84, 10).to(device)

def forward(self, x):
x = self.pool(F.relu(self.conv1(x)))
x = self.pool(F.relu(self.conv2(x)))
x = x.view(-1, 16 * 5 * 5)
x = F.relu(self.fc1(x))
x = F.relu(self.fc2(x))
x = self.fc3(x)
return x

net = Net2()
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.9)

for epoch in range(20):

    running_loss = 0.0
    for i, data in enumerate(trainloader, 0):
        # 得到输入
        inputs, labels = data
        inputs, labels = inputs.to(device), labels.to(device)
        # 梯度清零
        optimizer.zero_grad()

        # forward + backward + optimize
        outputs = net(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()

        # 定义统计信息
        running_loss += loss.item()
        if i % 2000 == 1999:
            print('[%d, %5d] loss: %.3f' %
                (epoch + 1, i + 1, running_loss / 2000))
            running_loss = 0.0

        print('Finished Training')

Original: https://blog.csdn.net/HUASHUDEYANJING/article/details/126452106
Author: 桦树无泪
Title: Pytorch速成教程（一）整体流程

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/760833/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python 对excel的函数操作（2）

1、用pandas的二维数组做除法运算，替换inf，过滤inf等操作 import pandas as pd import numpy as np 用pandas科学数据库操作ex…

Python 2023年8月16日
0037
小徐科研日记——深度学习视频分类方法

一、主要方法视频分类指将一段视频分类到预先制定类别集合中的某一个或多个。视频由空间维度和时间维度组成。包括静态图像特征，运动特征，音频特征，外部特征等。目前主要的方法有：双流网络…

Python 2023年9月16日
0041
python Scrapy爬取天气预报，零基础的你也可以快速上手

目的写一个真正意义上一个爬虫，并将他爬取到的数据分别保存到txt、json、已经存在的mysql数据库中。目标分析：初学者有什么不懂的可以私信我——我刚整理了一套2021最新…

Python 2023年10月2日
0043
假期离校必备：Mac远程连接Win10桌面（设置断电自动重启、Win10配置远程桌面、Microsoft Remote Desktop Beta远程桌面连接、将Win作为服务器可以conda跑代码）

假期离校必备：Mac远程连接Win10桌面（设置断电自动重启、Win10配置远程桌面、Microsoft Remote Desktop Beta远程桌面连接、将Win作为服务器可以…

Python 2023年9月9日
00274
Kaldi搭建语音识别系统—发音词典相关文件准备

Kaldi搭建语音识别系统实践——发音词典相关文件准备在上一篇文章，我们讲述了如何利用kaldi进行声学特征的提取，以及当前比较流行的声学特征(MFCC)。语音识别系统除了声学特…

Python 2023年10月26日
0037
利用Scrapy爬虫框架快速进行数据抓取

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

Python 2023年10月1日
0032
Matplotlib 散点图

我们可以使用 pyplot 中的 scatter() 方法来绘制散点图。 scatter() 方法语法格式如下： matplotlib .pyplot .scatter (x ,y…

Python 2023年9月1日
0040
python入门05 图形pygame

目录图形前提一、Pygame 二、 pygame窗口三、在窗口画圆解释一些需要了解的知识点 ⅰ 什么是翻转？ ⅱ 像素 ⅲ pygame 表面 ⅳ pygame中的颜色 …

Python 2023年9月23日
0032
python必备基础

1. 基础函数序号函数说明 1 print() 打印 2 input() 输入 3 int() 转化为整形 4 float() 转化为浮点型 5 str() 转化为字符串 6…

Python 2023年11月1日
0024
手把手教你使用LabVIEW人工智能视觉工具包快速实现图像读取与采集（含源码）

前言一、工具包位置二、图像采集与色彩空间转换 1.文件读写 2.实现图片读取 3.使用算子cvtColor实现颜色空间转换三、从摄像头采集图像 1.Camera类 2.属性节…

Python 2023年10月20日
0053
Yolov5如何更换EIOU / alpha IOU / SIoU？

🌟想了解YOLO系列算法更多教程欢迎订阅我的专栏🌟 对于基础薄弱的同学来说，推荐阅读《目标检测蓝皮书》 📘，里面涵盖了丰富的目标检测实用知识，是你迅速掌握目标检测的理想选择！如果…

Python 2023年8月1日
0067
java 返回字符串的函数_如何使这个函数返回一个字符串

我有这个代码： static char * display(const u8 array[], int length) { int i; char *str; for (i = 0…

Python 2023年11月7日
0059
MySQL数据库 | SQL语句详解

DDL解释： 1.数据库的常用操作 2.表结构的常用操作 3.修改表结构查看所有的数据库show databases; 创建表格式 use mydb3; create table…

Python 2023年9月27日
0033
pytest和unittest框架的区别

1、用例设计对比 1.1 unittest 测试类必须继承unittest.TestCase 测试函数必须以”test_”开头测试类必须有unittest…

Python 2023年9月14日
0047
pytest+request+allure+excel接口自动化搭建从0到1【二读取Excel Case信息】

读取Excel测试数据一、使用xlrd读取数据 * 1.1判断文件格式是否是xlrd开头 1.2读取数据返回List 二、使用pandas读取数据目前读取Excle数据有2种方…

Python 2023年9月14日
0069
Spring Boot 配置 jar 包外面的 Properties 配置文件

一、概述 Properties 文件是我们可以用来存储项目特定信息的常用方法。理想情况下，我们应该将其保留在 jar 包之外，以便能够根据需要对配置进行更改。二、使用默认位置按…

Python 2023年10月19日
0036

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Pytorch速成教程（一）整体流程