动手深度学习4——经典卷积神经网络

2023年5月28日下午4:32 • 人工智能 • 阅读 69

LeNet

先使用卷积层来学习图片空间信息，然后使用全连接层来转换到类别空间。

import torch
from torch import nn
from d2l import torch as d2l

class Reshape(torch.nn.Module):
    def forward(self,x):
        return x.view(-1,1,28,28)

net = nn.Sequential(
    Reshape(),
    nn.Conv2d(1, 6, kernel_size=5, padding=2), nn.Sigmoid(),
    nn.AvgPool2d(kernel_size=2, stride=2),
    nn.Conv2d(6, 16, kernel_size=5), nn.Sigmoid(),
    nn.AvgPool2d(kernel_size=2, stride=2),
    nn.Flatten(),
    nn.Linear(16 * 5 * 5, 120), nn.Sigmoid(),
    nn.Linear(120, 84), nn.Sigmoid(),
    nn.Linear(84, 10))

X = torch.rand(size=(1, 1, 28, 28), dtype=torch.float32)
for layer in net:
    X = layer(X)
    print(layer.__class__.__name__,'output shape: \t',X.shape)

def evaluate_accuracy_gpu(net, data_iter, device=None): #@save
    """&#x4F7F;&#x7528;GPU&#x8BA1;&#x7B97;&#x6A21;&#x578B;&#x5728;&#x6570;&#x636E;&#x96C6;&#x4E0A;&#x7684;&#x7CBE;&#x5EA6;"""
    if isinstance(net, nn.Module):
        net.eval()  # &#x8BBE;&#x7F6E;&#x4E3A;&#x8BC4;&#x4F30;&#x6A21;&#x5F0F;
        if not device:
            device = next(iter(net.parameters())).device
    # &#x6B63;&#x786E;&#x9884;&#x6D4B;&#x7684;&#x6570;&#x91CF;&#xFF0C;&#x603B;&#x9884;&#x6D4B;&#x7684;&#x6570;&#x91CF;
    metric = d2l.Accumulator(2)
    with torch.no_grad():
        for X, y in data_iter:
            if isinstance(X, list):
                # BERT&#x5FAE;&#x8C03;&#x6240;&#x9700;&#x7684;&#xFF08;&#x4E4B;&#x540E;&#x5C06;&#x4ECB;&#x7ECD;&#xFF09;
                X = [x.to(device) for x in X]
            else:
                X = X.to(device)
            y = y.to(device)
            metric.add(d2l.accuracy(net(X), y), y.numel())
    return metric[0] / metric[1]

#@save
def train_ch6(net, train_iter, test_iter, num_epochs, lr, device):
    """&#x7528;GPU&#x8BAD;&#x7EC3;&#x6A21;&#x578B;"""
    def init_weights(m):
        if type(m) == nn.Linear or type(m) == nn.Conv2d:
            nn.init.xavier_uniform_(m.weight)
    net.apply(init_weights)
    print('training on', device)
    net.to(device)
    optimizer = torch.optim.SGD(net.parameters(), lr=lr)
    loss = nn.CrossEntropyLoss()
    animator = d2l.Animator(xlabel='epoch', xlim=[1, num_epochs],
                            legend=['train loss', 'train acc', 'test acc'])
    timer, num_batches = d2l.Timer(), len(train_iter)
    for epoch in range(num_epochs):
        # &#x8BAD;&#x7EC3;&#x635F;&#x5931;&#x4E4B;&#x548C;&#xFF0C;&#x8BAD;&#x7EC3;&#x51C6;&#x786E;&#x7387;&#x4E4B;&#x548C;&#xFF0C;&#x6837;&#x672C;&#x6570;
        metric = d2l.Accumulator(3)
        net.train()
        for i, (X, y) in enumerate(train_iter):
            timer.start()
            optimizer.zero_grad()
            X, y = X.to(device), y.to(device)
            y_hat = net(X)
            l = loss(y_hat, y)
            l.backward()
            optimizer.step()
            with torch.no_grad():
                metric.add(l * X.shape[0], d2l.accuracy(y_hat, y), X.shape[0])
            timer.stop()
            train_l = metric[0] / metric[2]
            train_acc = metric[1] / metric[2]
            if (i + 1) % (num_batches // 5) == 0 or i == num_batches - 1:
                animator.add(epoch + (i + 1) / num_batches,
                             (train_l, train_acc, None))
        test_acc = evaluate_accuracy_gpu(net, test_iter)
        animator.add(epoch + 1, (None, None, test_acc))
    print(f'loss {train_l:.3f}, train acc {train_acc:.3f}, '
          f'test acc {test_acc:.3f}')
    print(f'{metric[2] * num_epochs / timer.sum():.1f} examples/sec '
          f'on {str(device)}')

lr, num_epochs = 0.9, 10
train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())

AlexNet

特点：

更大更深的LeNet
改进：丢弃法、relu（原先是sigmoid，用relu可减缓梯度消失）、maxpooling、数据增强

import torch
from torch import nn
from d2l import torch as d2l

net = nn.Sequential(
    # &#x8FD9;&#x91CC;&#xFF0C;&#x6211;&#x4EEC;&#x4F7F;&#x7528;&#x4E00;&#x4E2A;11*11&#x7684;&#x66F4;&#x5927;&#x7A97;&#x53E3;&#x6765;&#x6355;&#x6349;&#x5BF9;&#x8C61;&#x3002;&#x540C;&#x65F6;&#xFF0C;&#x6B65;&#x5E45;&#x4E3A;4&#xFF0C;&#x4EE5;&#x51CF;&#x5C11;&#x8F93;&#x51FA;&#x7684;&#x9AD8;
    #&#x5EA6;&#x548C;&#x5BBD;&#x5EA6;&#x3002;&#x8F93;&#x51FA;&#x901A;&#x9053;&#x7684;&#x6570;&#x76EE;&#x8FDC;&#x5927;&#x4E8E;LeNet
    nn.Conv2d(1, 96, kernel_size=11, stride=4, padding=1), nn.ReLU(),
    nn.MaxPool2d(kernel_size=3, stride=2),
    # &#x51CF;&#x5C0F;&#x5377;&#x79EF;&#x7A97;&#x53E3;&#xFF0C;&#x4F7F;&#x7528;&#x586B;&#x5145;&#x4E3A;2&#x6765;&#x4F7F;&#x5F97;&#x8F93;&#x5165;&#x4E0E;&#x8F93;&#x51FA;&#x7684;&#x9AD8;&#x548C;&#x5BBD;&#x4E00;&#x81F4;&#xFF0C;&#x4E14;&#x589E;&#x5927;&#x8F93;&#x51FA;&#x901A;&#x9053;&#x6570;
    nn.Conv2d(96, 256, kernel_size=5, padding=2), nn.ReLU(),
    nn.MaxPool2d(kernel_size=3, stride=2),
    # &#x4F7F;&#x7528;&#x4E09;&#x4E2A;&#x8FDE;&#x7EED;&#x7684;&#x5377;&#x79EF;&#x5C42;&#x548C;&#x8F83;&#x5C0F;&#x7684;&#x5377;&#x79EF;&#x7A97;&#x53E3;&#x3002;
    # &#x9664;&#x4E86;&#x6700;&#x540E;&#x7684;&#x5377;&#x79EF;&#x5C42;&#xFF0C;&#x8F93;&#x51FA;&#x901A;&#x9053;&#x7684;&#x6570;&#x91CF;&#x8FDB;&#x4E00;&#x6B65;&#x589E;&#x52A0;&#x3002;
    # &#x5728;&#x524D;&#x4E24;&#x4E2A;&#x5377;&#x79EF;&#x5C42;&#x4E4B;&#x540E;&#xFF0C;&#x6C47;&#x805A;&#x5C42;&#x4E0D;&#x7528;&#x4E8E;&#x51CF;&#x5C11;&#x8F93;&#x5165;&#x7684;&#x9AD8;&#x5EA6;&#x548C;&#x5BBD;&#x5EA6;
    nn.Conv2d(256, 384, kernel_size=3, padding=1), nn.ReLU(),
    nn.Conv2d(384, 384, kernel_size=3, padding=1), nn.ReLU(),
    nn.Conv2d(384, 256, kernel_size=3, padding=1), nn.ReLU(),
    nn.MaxPool2d(kernel_size=3, stride=2),nn.Flatten(),
    # &#x8FD9;&#x91CC;&#xFF0C;&#x5168;&#x8FDE;&#x63A5;&#x5C42;&#x7684;&#x8F93;&#x51FA;&#x6570;&#x91CF;&#x662F;LeNet&#x4E2D;&#x7684;&#x597D;&#x51E0;&#x500D;&#x3002;&#x4F7F;&#x7528;dropout&#x5C42;&#x6765;&#x51CF;&#x8F7B;&#x8FC7;&#x62DF;&#x5408;
    nn.Linear(6400, 4096), nn.ReLU(),nn.Dropout(p=0.5),
    nn.Linear(4096, 4096), nn.ReLU(),nn.Dropout(p=0.5),
    # &#x6700;&#x540E;&#x662F;&#x8F93;&#x51FA;&#x5C42;&#x3002;&#x8FD9;&#x91CC;&#x4F7F;&#x7528;Fashion-MNIST&#xFF0C;&#x6240;&#x4EE5;&#x7528;&#x7C7B;&#x522B;&#x6570;&#x4E3A;10&#xFF0C;&#x800C;&#x975E;&#x8BBA;&#x6587;&#x4E2D;&#x7684;1000
    nn.Linear(4096, 10))

X = torch.randn(1, 1, 224, 224)
for layer in net:
    X=layer(X)
    print(layer.__class__.__name__,'output shape:\t',X.shape)
batch_size = 128
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size, resize=224)
lr, num_epochs = 0.01, 10
d2l.train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())

VGG

经典卷积神经网络组成：1.带填充以保持分辨率的卷积层 2.非线性激活函数，如relu 3.池化层

VGG块与之类似

import torch
from torch import nn
from d2l import torch as d2l

def vgg_block(num_convs, in_channels, out_channels):
    layers = []
    for _ in range(num_convs):
        layers.append(nn.Conv2d(in_channels, out_channels,
                                kernel_size=3, padding=1))
        layers.append(nn.ReLU())
        in_channels = out_channels
    layers.append(nn.MaxPool2d(kernel_size=2,stride=2))
    return nn.Sequential(*layers)

def vgg(conv_arch):
    conv_blks = []
    in_channels = 1
    # &#x5377;&#x79EF;&#x5C42;&#x90E8;&#x5206;
    for (num_convs, out_channels) in conv_arch:
        conv_blks.append(vgg_block(num_convs, in_channels, out_channels))
        in_channels = out_channels

    return nn.Sequential(
        *conv_blks, nn.Flatten(),
        # &#x5168;&#x8FDE;&#x63A5;&#x5C42;&#x90E8;&#x5206;
        nn.Linear(out_channels * 7 * 7, 4096), nn.ReLU(), nn.Dropout(0.5),
        nn.Linear(4096, 4096), nn.ReLU(), nn.Dropout(0.5),
        nn.Linear(4096, 10))

net = vgg(conv_arch)
X = torch.randn(size=(1, 1, 224, 224))
for blk in net:
    X = blk(X)
    print(blk.__class__.__name__,'output shape:\t',X.shape)
ratio = 4
small_conv_arch = [(pair[0], pair[1] // ratio) for pair in conv_arch]
net = vgg(small_conv_arch)
lr, num_epochs, batch_size = 0.05, 10, 128
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size, resize=224)
d2l.train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())

NiN

LeNet、AlexNet和VGG的共同特点是都使用了全连接层，但全连接层需要过多的参数量，会导致占用过多内存、计算带宽、容易过拟合。

卷积层参数：

（较少）

卷积层后第一个全连接层参数：LeNet 1655120=48k AlexNet 256554096=26M

VGG 51277*4096=102M

_NiN_简单的解决方案：在每个像素的通道上分别使用多层感知机

NiN块

一个卷积层后跟两个全连接层，步幅1，无填充，输出形状跟卷积层输出一样，起到全连接层的作用。作用就是对通道数进行混合

NiN模型

无全连接层，交替使用NiN块和步幅为2的最大池化层，逐步减小高宽和增大通道数；最后使用全局平均池化层得到输出，其输出就是类别数。

import torch
from torch import nn
from d2l import torch as d2l

def nin_block(in_channels, out_channels, kernel_size, strides, padding):
    return nn.Sequential(
        nn.Conv2d(in_channels, out_channels, kernel_size, strides, padding),
        nn.ReLU(),
        nn.Conv2d(out_channels, out_channels, kernel_size=1), nn.ReLU(),
        nn.Conv2d(out_channels, out_channels, kernel_size=1), nn.ReLU())

net = nn.Sequential(
    nin_block(1, 96, kernel_size=11, strides=4, padding=0),
    nn.MaxPool2d(3, stride=2),
    nin_block(96, 256, kernel_size=5, strides=1, padding=2),
    nn.MaxPool2d(3, stride=2),
    nin_block(256, 384, kernel_size=3, strides=1, padding=1),
    nn.MaxPool2d(3, stride=2),
    nn.Dropout(0.5),
    # &#x6807;&#x7B7E;&#x7C7B;&#x522B;&#x6570;&#x662F;10
    nin_block(384, 10, kernel_size=3, strides=1, padding=1),
    nn.AdaptiveAvgPool2d((1, 1)),
    # &#x5C06;&#x56DB;&#x7EF4;&#x7684;&#x8F93;&#x51FA;&#x8F6C;&#x6210;&#x4E8C;&#x7EF4;&#x7684;&#x8F93;&#x51FA;&#xFF0C;&#x5176;&#x5F62;&#x72B6;&#x4E3A;(&#x6279;&#x91CF;&#x5927;&#x5C0F;,10)
    nn.Flatten())

X = torch.rand(size=(1, 1, 224, 224))
for layer in net:
    X = layer(X)
    print(layer.__class__.__name__,'output shape:\t', X.shape)

lr, num_epochs, batch_size = 0.1, 10, 128
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size, resize=224)
d2l.train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())

GoogLeNet

吸收了NiN中串联网络的思想，并在此基础上做了改进。重点是解决了什么样大小的卷积核最合适的问题。毕竟，以前流行的网络使用小到1×1，大到11×11的卷积核。本文的一个观点是，有时使用不同大小的卷积核组合是有利的。

Inception块

由四条并行路径组成。前三条路径使用窗口大小为1×1、3×3和5×5的卷积层，从不同空间大小中提取信息。中间的两条路径在输入上执行1×1卷积，以减少通道数，从而降低模型的复杂性。第四条路径使用3×3最大汇聚层，然后使用1×1卷积层来改变通道数。这四条路径都使用合适的填充来使输入与输出的高和宽一致，最后我们将每条线路的输出在通道维度上连结，并构成Inception块的输出。在Inception块中，通常调整的超参数是每层输出通道数。（白色用来改变通道数，蓝色用来抽取信息，不抽取通道信息，只抽取空间信息）

模型

一共使用9个Inception块和全局平均汇聚层的堆叠来生成其估计值。Inception块之间的最大汇聚层可降低维度。第一个模块类似于AlexNet和LeNet，Inception块的组合从VGG继承，全局平均汇聚层避免了在最后使用全连接层。

批量归一化

损失出现在最后，后面的层训练较快；数据在最底部，底部层训练较慢，底部层一变化，所有都得跟着变，最后的那些层需要重新学习多次，导致收敛变慢。批量归一化解决在学习底部层的时候避免变化顶部。

方法：固定小批量里的均值和方差

然后再做额外的调整（可学习的参数）

总结：批量归一化固定小批量中的均值和方差，然后学习出适合的偏移和缩放

可以加速收敛速度（允许用更大的学习率），但一般不改变模型精度

import torch
from torch import nn
from d2l import torch as d2l

def batch_norm(X, gamma, beta, moving_mean, moving_var, eps, momentum):
    # &#x901A;&#x8FC7;is_grad_enabled&#x6765;&#x5224;&#x65AD;&#x5F53;&#x524D;&#x6A21;&#x5F0F;&#x662F;&#x8BAD;&#x7EC3;&#x6A21;&#x5F0F;&#x8FD8;&#x662F;&#x9884;&#x6D4B;&#x6A21;&#x5F0F;
    if not torch.is_grad_enabled():
        # &#x5982;&#x679C;&#x662F;&#x5728;&#x9884;&#x6D4B;&#x6A21;&#x5F0F;&#x4E0B;&#xFF0C;&#x76F4;&#x63A5;&#x4F7F;&#x7528;&#x4F20;&#x5165;&#x7684;&#x79FB;&#x52A8;&#x5E73;&#x5747;&#x6240;&#x5F97;&#x7684;&#x5747;&#x503C;&#x548C;&#x65B9;&#x5DEE;
        X_hat = (X - moving_mean) / torch.sqrt(moving_var + eps)
    else:
        assert len(X.shape) in (2, 4)
        if len(X.shape) == 2:
            # &#x4F7F;&#x7528;&#x5168;&#x8FDE;&#x63A5;&#x5C42;&#x7684;&#x60C5;&#x51B5;&#xFF0C;&#x8BA1;&#x7B97;&#x7279;&#x5F81;&#x7EF4;&#x4E0A;&#x7684;&#x5747;&#x503C;&#x548C;&#x65B9;&#x5DEE;
            mean = X.mean(dim=0)
            var = ((X - mean) ** 2).mean(dim=0)
        else:
            # &#x4F7F;&#x7528;&#x4E8C;&#x7EF4;&#x5377;&#x79EF;&#x5C42;&#x7684;&#x60C5;&#x51B5;&#xFF0C;&#x8BA1;&#x7B97;&#x901A;&#x9053;&#x7EF4;&#x4E0A;&#xFF08;axis=1&#xFF09;&#x7684;&#x5747;&#x503C;&#x548C;&#x65B9;&#x5DEE;&#x3002;
            # &#x8FD9;&#x91CC;&#x6211;&#x4EEC;&#x9700;&#x8981;&#x4FDD;&#x6301;X&#x7684;&#x5F62;&#x72B6;&#x4EE5;&#x4FBF;&#x540E;&#x9762;&#x53EF;&#x4EE5;&#x505A;&#x5E7F;&#x64AD;&#x8FD0;&#x7B97;
            mean = X.mean(dim=(0, 2, 3), keepdim=True)
            var = ((X - mean) ** 2).mean(dim=(0, 2, 3), keepdim=True)
        # &#x8BAD;&#x7EC3;&#x6A21;&#x5F0F;&#x4E0B;&#xFF0C;&#x7528;&#x5F53;&#x524D;&#x7684;&#x5747;&#x503C;&#x548C;&#x65B9;&#x5DEE;&#x505A;&#x6807;&#x51C6;&#x5316;
        X_hat = (X - mean) / torch.sqrt(var + eps)
        # &#x66F4;&#x65B0;&#x79FB;&#x52A8;&#x5E73;&#x5747;&#x7684;&#x5747;&#x503C;&#x548C;&#x65B9;&#x5DEE;
        moving_mean = momentum * moving_mean + (1.0 - momentum) * mean
        moving_var = momentum * moving_var + (1.0 - momentum) * var
    Y = gamma * X_hat + beta  # &#x7F29;&#x653E;&#x548C;&#x79FB;&#x4F4D;
    return Y, moving_mean.data, moving_var.data

class BatchNorm(nn.Module):
    # num_features&#xFF1A;&#x5B8C;&#x5168;&#x8FDE;&#x63A5;&#x5C42;&#x7684;&#x8F93;&#x51FA;&#x6570;&#x91CF;&#x6216;&#x5377;&#x79EF;&#x5C42;&#x7684;&#x8F93;&#x51FA;&#x901A;&#x9053;&#x6570;&#x3002;
    # num_dims&#xFF1A;2&#x8868;&#x793A;&#x5B8C;&#x5168;&#x8FDE;&#x63A5;&#x5C42;&#xFF0C;4&#x8868;&#x793A;&#x5377;&#x79EF;&#x5C42;
    def __init__(self, num_features, num_dims):
        super().__init__()
        if num_dims == 2:
            shape = (1, num_features)
        else:
            shape = (1, num_features, 1, 1)
        # &#x53C2;&#x4E0E;&#x6C42;&#x68AF;&#x5EA6;&#x548C;&#x8FED;&#x4EE3;&#x7684;&#x62C9;&#x4F38;&#x548C;&#x504F;&#x79FB;&#x53C2;&#x6570;&#xFF0C;&#x5206;&#x522B;&#x521D;&#x59CB;&#x5316;&#x6210;1&#x548C;0
        self.gamma = nn.Parameter(torch.ones(shape))
        self.beta = nn.Parameter(torch.zeros(shape))
        # &#x975E;&#x6A21;&#x578B;&#x53C2;&#x6570;&#x7684;&#x53D8;&#x91CF;&#x521D;&#x59CB;&#x5316;&#x4E3A;0&#x548C;1
        self.moving_mean = torch.zeros(shape)
        self.moving_var = torch.ones(shape)

    def forward(self, X):
        # &#x5982;&#x679C;X&#x4E0D;&#x5728;&#x5185;&#x5B58;&#x4E0A;&#xFF0C;&#x5C06;moving_mean&#x548C;moving_var
        # &#x590D;&#x5236;&#x5230;X&#x6240;&#x5728;&#x663E;&#x5B58;&#x4E0A;
        if self.moving_mean.device != X.device:
            self.moving_mean = self.moving_mean.to(X.device)
            self.moving_var = self.moving_var.to(X.device)
        # &#x4FDD;&#x5B58;&#x66F4;&#x65B0;&#x8FC7;&#x7684;moving_mean&#x548C;moving_var
        Y, self.moving_mean, self.moving_var = batch_norm(X, self.gamma,
        self.beta, self.moving_mean,self.moving_var, eps=1e-5, momentum=0.9)
        return Y

ResNet

残差网络的核心思想是：每个附加层都应该更容易地包含原始函数作为其元素之一。

残差块里首先有2个有相同输出通道数的3×3卷积层。每个卷积层后接一个批量规范化层和ReLU激活函数。然后我们通过跨层数据通路，跳过这2个卷积运算，将输入直接加在最后的ReLU激活函数前。这样的设计要求2个卷积层的输出与输入形状一样，从而使它们可以相加。如果想改变通道数，就需要引入一个额外的1×1卷积层来将输入变换成需要的形状后再做相加运算。

import torch
from torch import nn
from torch.nn import functional as F
from d2l import torch as d2l

class Residual(nn.Module):  #@save
    def __init__(self, input_channels, num_channels,
                 use_1x1conv=False, strides=1):
        super().__init__()
        self.conv1 = nn.Conv2d(input_channels, num_channels,
                               kernel_size=3, padding=1, stride=strides)
        self.conv2 = nn.Conv2d(num_channels, num_channels,
                               kernel_size=3, padding=1)
        if use_1x1conv:
            self.conv3 = nn.Conv2d(input_channels, num_channels,
                                   kernel_size=1, stride=strides)
        else:
            self.conv3 = None
        self.bn1 = nn.BatchNorm2d(num_channels)
        self.bn2 = nn.BatchNorm2d(num_channels)

    def forward(self, X):
        Y = F.relu(self.bn1(self.conv1(X)))
        Y = self.bn2(self.conv2(Y))
        if self.conv3:
            X = self.conv3(X)
        Y += X
        return F.relu(Y)

def resnet_block(input_channels, num_channels, num_residuals,
                 first_block=False):
    blk = []
    for i in range(num_residuals):
        if i == 0 and not first_block:
            blk.append(Residual(input_channels, num_channels,
                                use_1x1conv=True, strides=2))
        else:
            blk.append(Residual(num_channels, num_channels))
    return blk

b1 = nn.Sequential(nn.Conv2d(1, 64, kernel_size=7, stride=2, padding=3),
                   nn.BatchNorm2d(64), nn.ReLU(),
                   nn.MaxPool2d(kernel_size=3, stride=2, padding=1))
b2 = nn.Sequential(*resnet_block(64, 64, 2, first_block=True))
b3 = nn.Sequential(*resnet_block(64, 128, 2))
b4 = nn.Sequential(*resnet_block(128, 256, 2))
b5 = nn.Sequential(*resnet_block(256, 512, 2))
net = nn.Sequential(b1, b2, b3, b4, b5,
                    nn.AdaptiveAvgPool2d((1,1)),
                    nn.Flatten(), nn.Linear(512, 10))

X = torch.rand(size=(1, 1, 224, 224))
for layer in net:
    X = layer(X)
    print(layer.__class__.__name__,'output shape:\t', X.shape)

lr, num_epochs, batch_size = 0.05, 10, 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size, resize=96)
d2l.train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())

Original: https://blog.csdn.net/xiaoyuia/article/details/123612610
Author: 小雨啊啊啊.
Title: 动手深度学习4——经典卷积神经网络

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/532539/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

语音识别：时间序列的动态扭曲相似度（DTW）算法

目录一、说明二、DTW算法原理分析 2.1 约束和限定 2.2 朴素的匹配 2.3 带有窗口范围的匹配三、DTW用于语音匹配 1）m和n不一定相等，这不必担心，在算法中将产生…

人工智能 2023年5月27日
00114
OSError: [WinError 127] 找不到指定的程序。 Error loading “C:Anaconda3envsMachine_Learninglibsite-package

OSError: [WinError 127] 找不到指定的程序。 Error loading “C:\Anaconda3\envs\Machine_Learning\…

人工智能 2023年7月22日
0050
百分点大数据技术团队：基于HugeGraph的知识图谱技术在白酒行业的落地实践

编者按：信息化是企业在外部环境变化时保持核心竞争力的有力手段。在白酒企业信息化过程中，通过应用大数据、云计算等的新智慧营销方式，精准定位消费群体，将对中国白酒未来营销起到革命性作用…

人工智能 2023年6月1日
0089
OpenCV-Python实战（8）——直方图均衡化

OpenCV-Python实战（8）——直方图均衡化 * – 0. 前言 – 1. 灰度直方图均衡化 – 2. 颜色直方图均衡化 –…

人工智能 2023年7月19日
0054
机器学习及其MATLAB实现——BP神经网络

Multiply its output delta and input activation to get the gradient of the weight.、 Bring t…

人工智能 2023年7月27日
0043
Offboard 3D Object Detection From Point Cloud Sequences

声明原文链接摘要虽然当前的3D对象识别研究主要集中在实时车载场景中，但许多非车载感知用例在很大程度上没有得到充分的探索，例如使用机器自动生成高质量的3D标签。由于有限的输入和…

人工智能 2023年7月10日
0054
图像分割论文阅读笔记——U-Net: Convolutional Networks for Biomedical Image Segmentation

文章来源 https://paperswithcode.com/paper/u-net-convolutional-networks-for-biomedical U-Net: C…

人工智能 2023年6月22日
0061
深度强化学习 DQN算法

目录一.算法介绍二.算法原理三.代码实现[1] 参考一.算法介绍 DQN算法，英文名为Deep Q Network，被称为深度Q网络，其将深度神经网络结合了Q-learn…

人工智能 2023年7月14日
0059
10.1 Python图像处理之边缘算子-Sobel算子、Roberts算子、拉普拉斯算子、Canny算子、Prewitt算子、高斯拉普拉斯算子

10.1 Python图像处理之边缘算子-Sobel算子、Roberts算子、拉普拉斯算子、Canny算子、Prewitt算子、高斯拉普拉斯算子文章目录 10.1 Python图…

人工智能 2023年6月17日
00151
JavaScript：日期对象

日期对象 js种的一个内置方法，用于处理日期与时间相关的操作创建日期对象 new Date() 创建一个和日期有关的对象 new Date()里可以接收参数 1.没有参数 var…

人工智能 2023年6月29日
0063
保姆级深度学习环境搭建（亲测避坑）

一、安装显卡驱动 1、查看显卡驱动型号可以打开任务管理器，点开性能，看到显卡名字； 2、下载显卡驱动进入英伟达官网，下载对应的显卡驱动：官方驱动 | NVIDIAhttps:/…

人工智能 2023年5月28日
0076
LabVIEW开放神经网络交互工具包（ONNX)下载与超详细安装教程

文章目录前言一、LabVIEW开放神经网络交互工具包（ONNX)简介二、安装前的准备工作三、LabVIEW开放神经网络交互工具包（ONNX）下载四、LabVIEW开放神经…

人工智能 2023年7月12日
0071
vue自适应布局（各种浏览器，分辨率）

1.前言 spa页面的layout布局对于前端项目的影响至关重要，在我们进行web端开发的时候，前端的各种大小屏幕，各种内核的浏览器不同，会导致我们的页面呈现出不一样的效果，如何进…

人工智能 2023年6月2日
0065
proxmox 直通显卡（GPU）

序号修订内容修订时间1新增20210622 本文主要介绍基于proxmox 虚拟机直通显卡，最终希望在该宿主机上建两个虚机，各自直通一张gpu 卡，两台虚机同时使用。（一）物理…

人工智能 2023年7月12日
0059
如何在anaconda里面安装pytorch

巧妙的方法直接在自己的环境终端下输入，我一般都是这样安装，很方便稳定。 pip install torch==1.7.0+cu110 torchvision==0.8.1+cu1…

人工智能 2023年7月28日
0061
NXP mx8平台tensorflow-lite build error

NXP提供的方案 1、使用bitbake编译tensorflow-lite bitbake tensorflow-lite -c do_configure -v -f 出现以下错误…

人工智能 2023年5月25日
0058

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30