刘二大人 PyTorch深度学习实践笔记 P11 卷积神经网络（高级篇）

2023年7月22日上午1:31 • 人工智能 • 阅读 55

刘二大人 PyTorch深度学习实践笔记 P11 卷积神经网络（高级篇）

1、GoogleNet
*
I 网络结构
II 减少代码冗余思想(减少代码重复)
2、Inception Module
*
I 基本概念
III 代码实现
II Stack Layer
3、residual net
*
I 普通网络与残差网络的区别
II Residual block
III 代码实现
4、作业
*
作业1：阅读论文 Identity Mappings in Deep Residual Networks
实现 constant scaling
实现conv shortcut
5、建议学习流程

1、GoogleNet

I 网络结构

神经网络当中还有许多更为复杂的网络结构，那么它们如何来实现？用什么样的方法？GoogleNet网络结构如图所示：

GoogleNet常被用作基础主干网络，图中红色圈出的一个部分称为Inception块。

; II 减少代码冗余思想(减少代码重复)

在c语言中使用函数
面向对象过程中时构造类
在GoogleNet中把相同的块封装成一个类来减少代码冗余。

2、Inception Module

I 基本概念

问题： 构造神经网络时，超参数比较难选，比如kernel。
解决办法： 把几种卷积都用一下，效果更好的卷积被赋予的权重会更大，自动找到最优卷积的组合，针对每一个卷积结果再进行求和。

concarenate： 把张量拼接起来，必须保证图像的宽度和高度是一致的。
均值池化： 最大池化会导致图像变为原来的一半，均值池化可以人为指定padding 和 stride 来保证输入和输出的图像是一样的。
信息融合： 本质就是得到的值通过三个值通过某种运算得到的信息。考试对各科分数求总分进行比较分数高低，在多个维度下不太好比较。
1*1卷积： 也是相同大小的卷积核，其个数取决于输入张量的通道，最主要目的就是改变通道的数量，减少运算量。

此处就是在做一个通道的变换，原通道数为3，新的通道数是卷积核的个数，高度和宽度不变。

运算量变成了原来的十分之一，大大提高了计算效率。

; III 代码实现

import torch
from torch import nn
from torchvision import transforms
from torchvision import datasets
from torch.utils.data import DataLoader
import torch.nn.functional as F
import torch.optim as optim
import matplotlib.pyplot as plt

batch_size = 64
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.1307, ), (0.3081, ))
])

train_dataset = datasets.MNIST(root='dataset/mnist',
                               train=True,
                               download=True,
                               transform=transform)
train_loader = DataLoader(dataset=train_dataset,
                          batch_size=batch_size,
                          shuffle=True)

test_dataset = datasets.MNIST(root='dataset/mnist',
                              train=False,
                              download=True,
                              transform=transform)
test_loader = DataLoader(dataset=test_dataset,
                         batch_size=batch_size,
                         shuffle=False)

class InceptionA(nn.Module):
    def __init__(self, in_channels):
        super(InceptionA, self).__init__()
        self.branch1X1 = nn.Conv2d(in_channels, 16, kernel_size=1)

        self.branch5X5_1 = nn.Conv2d(in_channels, 16, kernel_size=1)
        self.branch5X5_2 = nn.Conv2d(16, 24, kernel_size=5, padding=2)

        self.branch3X3_1 = nn.Conv2d(in_channels, 16, kernel_size=1)
        self.branch3X3_2 = nn.Conv2d(16, 24, kernel_size=3, padding=1)
        self.branch3X3_3 = nn.Conv2d(24, 24, kernel_size=3, padding=1)

        self.branch_pool = nn.Conv2d(in_channels, 24, kernel_size=1)

    def forward(self, x):
        branch1X1 = self.branch1X1(x)

        branch5X5 = self.branch5X5_1(x)
        branch5X5 = self.branch5X5_2(branch5X5)

        branch3X3 = self.branch3X3_1(x)
        branch3X3 = self.branch3X3_2(branch3X3)
        branch3X3 = self.branch3X3_3(branch3X3)

        branch_pool = F.avg_pool2d(x, kernel_size=3, stride=1, padding=1)
        branch_pool = self.branch_pool(branch_pool)

        outputs = [branch1X1, branch5X5, branch3X3, branch_pool]

        return torch.cat(outputs, dim=1)

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(1, 10, kernel_size=5)

        self.conv2 = nn.Conv2d(88, 20, kernel_size=5)

        self.incep1 = InceptionA(in_channels=10)
        self.incep2 = InceptionA(in_channels=20)

        self.mp = nn.MaxPool2d(2)

        self.fc = nn.Linear(1408, 10)

    def forward(self, x):
        in_size = x.size(0)

        x = F.relu(self.mp(self.conv1(x)))

        x = self.incep1(x)

        x = F.relu(self.mp(self.conv2(x)))

        x = self.incep2(x)
        x = x.view(in_size, -1)
        x = self.fc(x)
        return x

model = Net()

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

model.to(device)

criterion = torch.nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.5)

def train(epoch):
    running_loss = 0
    for batch_idx, data in enumerate(train_loader, 0):
        inputs, target = data

        inputs, target = inputs.to(device), target.to(device)
        optimizer.zero_grad()

        outputs = model(inputs)
        loss = criterion(outputs, target)
        loss.backward()
        optimizer.step()

        running_loss += loss.item()
        if batch_idx % 300 == 299:
            print('[%d, %5d] loss: %.3f' % (epoch + 1, batch_idx + 1, running_loss / 300))
            running_loss = 0

accuracy = []
def test():
    correct = 0
    total = 0
    with torch.no_grad():
        for data in test_loader:
            images, labels = data

            images, labels = images.to(device), labels.to(device)
            outputs = model(images)
            _, predicted = torch.max(outputs.data, dim=1)
            total += labels.size(0)

            correct += (predicted == labels).sum().item()
    print('Accuracy on test  set: %d %%' % (100 * correct / total))
    accuracy.append(100 * correct / total)

if __name__ == '__main__':
    for epoch in range(10):
        train(epoch)
        test()
    print(accuracy)
    plt.plot(range(10), accuracy)
    plt.xlabel("epoch")
    plt.ylabel("Accuracy")
    plt.show()

输出：

[1,   300] loss: 0.767
[1,   600] loss: 0.186
[1,   900] loss: 0.141
Accuracy on test  set: 96 %
[2,   300] loss: 0.109
[2,   600] loss: 0.098
[2,   900] loss: 0.096
Accuracy on test  set: 97 %
[3,   300] loss: 0.083
[3,   600] loss: 0.076
[3,   900] loss: 0.076
Accuracy on test  set: 97 %
[4,   300] loss: 0.066
[4,   600] loss: 0.066
[4,   900] loss: 0.064
Accuracy on test  set: 98 %
[5,   300] loss: 0.054
[5,   600] loss: 0.057
[5,   900] loss: 0.054
Accuracy on test  set: 98 %
[6,   300] loss: 0.049
[6,   600] loss: 0.052
[6,   900] loss: 0.049
Accuracy on test  set: 98 %
[7,   300] loss: 0.044
[7,   600] loss: 0.047
[7,   900] loss: 0.042
Accuracy on test  set: 98 %
[8,   300] loss: 0.043
[8,   600] loss: 0.039
[8,   900] loss: 0.041
Accuracy on test  set: 98 %
[9,   300] loss: 0.034
[9,   600] loss: 0.041
[9,   900] loss: 0.038
Accuracy on test  set: 98 %
[10,   300] loss: 0.034
[10,   600] loss: 0.035
[10,   900] loss: 0.033
Accuracy on test  set: 98 %
[96.51, 97.37, 97.94, 98.45, 98.31, 98.58, 98.59, 98.8, 98.73, 98.9]

性能提高不多，可能是最好全连接层太少，训练次数不一定越多越好，当前网络参数可以进行存盘，存储训练效果最好的结果。

II Stack Layer

问题： 为什么网络层数更深反而准确率会下降，训练效果更差？

梯度消失： 在反向传播时需要根据链式法则把一连串的梯度乘起来，若每个梯度都小于1，则乘起来的结果会接近于0，导致权重在更新时得不到什么更新，进而导致最开始的这些块（离输入近的块）没办法得到充分的训练。
解决办法： 逐层训练，每一层加锁，但是深度学习中层数太多了，难以实现。

; 3、residual net

I 普通网络与残差网络的区别

残差网络多一个跳连接，在做完卷积激活之前，将该层的输入加上输出一起作为整个的输出来激活。

; II Residual block

偏导数+1一定大于等于1，所以不会出现梯度消失的问题。

III 代码实现

import torch
from torch import nn
from torchvision import transforms
from torchvision import datasets
from torch.utils.data import DataLoader
import torch.nn.functional as F
import torch.optim as optim
import matplotlib.pyplot as plt

batch_size = 64
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.1307, ), (0.3081, ))
])

train_dataset = datasets.MNIST(root='dataset/mnist',
                               train=True,
                               download=True,
                               transform=transform)
train_loader = DataLoader(dataset=train_dataset,
                          batch_size=batch_size,
                          shuffle=True)

test_dataset = datasets.MNIST(root='dataset/mnist',
                              train=False,
                              download=True,
                              transform=transform)
test_loader = DataLoader(dataset=test_dataset,
                         batch_size=batch_size,
                         shuffle=False)

class ResidualBlock(nn.Module):
    def __init__(self, channels):
        super(ResidualBlock, self).__init__()
        self.channels = channels
        self.conv1 = nn.Conv2d(channels, channels, kernel_size=3, padding=1)
        self.conv2 = nn.Conv2d(channels, channels, kernel_size=3, padding=1)

    def forward(self, x):
        y = F.relu(self.conv1(x))
        y = self.conv2(y)
        return F.relu(x + y)

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(1,16, kernel_size=5)
        self.conv2 = nn.Conv2d(16, 32, kernel_size=5)
        self.mp = nn.MaxPool2d(2)

        self.rblock1 = ResidualBlock(16)
        self.rblock2 = ResidualBlock(32)

        self.fc = nn.Linear(512, 10)

    def forward(self, x):
        in_size = x.size(0)
        x = self.mp(F.relu(self.conv1(x)))
        x = self.rblock1(x)
        x = self.mp(F.relu(self.conv2(x)))
        x = self.rblock2(x)
        x = x.view(in_size, -1)
        x = self.fc(x)
        return x

model = Net()

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

model.to(device)

criterion = torch.nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.5)

def train(epoch):
    running_loss = 0
    for batch_idx, data in enumerate(train_loader, 0):
        inputs, target = data

        inputs, target = inputs.to(device), target.to(device)
        optimizer.zero_grad()

        outputs = model(inputs)
        loss = criterion(outputs, target)
        loss.backward()
        optimizer.step()

        running_loss += loss.item()
        if batch_idx % 300 == 299:
            print('[%d, %5d] loss: %.3f' % (epoch + 1, batch_idx + 1, running_loss / 300))
            running_loss = 0

accuracy = []
def test():
    correct = 0
    total = 0
    with torch.no_grad():
        for data in test_loader:
            images, labels = data

            images, labels = images.to(device), labels.to(device)
            outputs = model(images)
            _, predicted = torch.max(outputs.data, dim=1)
            total += labels.size(0)

            correct += (predicted == labels).sum().item()
    print('Accuracy on test  set: %d %%' % (100 * correct / total))
    accuracy.append(100 * correct / total)

if __name__ == '__main__':
    for epoch in range(10):
        train(epoch)
        test()
    print(accuracy)
    plt.plot(range(10), accuracy)
    plt.xlabel("epoch")
    plt.ylabel("Accuracy")
    plt.show()

输出：

[1,   300] loss: 0.520
[1,   600] loss: 0.159
[1,   900] loss: 0.118
Accuracy on test  set: 97 %
[2,   300] loss: 0.090
[2,   600] loss: 0.081
[2,   900] loss: 0.074
Accuracy on test  set: 98 %
[3,   300] loss: 0.063
[3,   600] loss: 0.058
[3,   900] loss: 0.055
Accuracy on test  set: 98 %
[4,   300] loss: 0.046
[4,   600] loss: 0.050
[4,   900] loss: 0.048
Accuracy on test  set: 98 %
[5,   300] loss: 0.044
[5,   600] loss: 0.038
[5,   900] loss: 0.038
Accuracy on test  set: 98 %
[6,   300] loss: 0.035
[6,   600] loss: 0.033
[6,   900] loss: 0.034
Accuracy on test  set: 98 %
[7,   300] loss: 0.028
[7,   600] loss: 0.029
[7,   900] loss: 0.032
Accuracy on test  set: 98 %
[8,   300] loss: 0.027
[8,   600] loss: 0.028
[8,   900] loss: 0.026
Accuracy on test  set: 98 %
[9,   300] loss: 0.021
[9,   600] loss: 0.026
[9,   900] loss: 0.022
Accuracy on test  set: 98 %
[10,   300] loss: 0.021
[10,   600] loss: 0.023
[10,   900] loss: 0.021
Accuracy on test  set: 98 %
[97.03, 98.21, 98.47, 98.8, 98.52, 98.88, 98.88, 98.98, 98.95, 98.98]

4、作业

作业1：阅读论文 Identity Mappings in Deep Residual Networks

给出了很多residual block实现的方式。

; 实现 constant scaling

返回结果为原来的一半

class ResidualBlock(nn.Module):
    def __init__(self, channels):
        super(ResidualBlock, self).__init__()
        self.channels = channels
        self.conv1 = nn.Conv2d(channels, channels, kernel_size=3, padding=1)
        self.conv2 = nn.Conv2d(channels, channels, kernel_size=3, padding=1)

    def forward(self, x):
        y = F.relu(self.conv1(x))
        y = self.conv2(x)
        z = 0.5 * (x + y)
        return F.relu(z)

输出：

[1,   300] loss: 0.947
[1,   600] loss: 0.252
[1,   900] loss: 0.173
Accuracy on test  set: 96 %
[2,   300] loss: 0.126
[2,   600] loss: 0.113
[2,   900] loss: 0.107
Accuracy on test  set: 97 %
[3,   300] loss: 0.085
[3,   600] loss: 0.084
[3,   900] loss: 0.077
Accuracy on test  set: 98 %
[4,   300] loss: 0.064
[4,   600] loss: 0.066
[4,   900] loss: 0.068
Accuracy on test  set: 98 %
[5,   300] loss: 0.057
[5,   600] loss: 0.058
[5,   900] loss: 0.055
Accuracy on test  set: 98 %
[6,   300] loss: 0.051
[6,   600] loss: 0.051
[6,   900] loss: 0.047
Accuracy on test  set: 98 %
[7,   300] loss: 0.042
[7,   600] loss: 0.044
[7,   900] loss: 0.048
Accuracy on test  set: 98 %
[8,   300] loss: 0.041
[8,   600] loss: 0.040
[8,   900] loss: 0.040
Accuracy on test  set: 98 %
[9,   300] loss: 0.035
[9,   600] loss: 0.037
[9,   900] loss: 0.037
Accuracy on test  set: 98 %
[10,   300] loss: 0.031
[10,   600] loss: 0.038
[10,   900] loss: 0.031
Accuracy on test  set: 98 %
[96.09, 97.78, 98.07, 98.29, 98.41, 98.67, 98.03, 98.86, 98.75, 98.81]

实现conv shortcut

多进行一次卷积

class ResidualBlock(nn.Module):
    def __init__(self, channels):
        super(ResidualBlock, self).__init__()
        self.channels = channels

        self.conv1 = nn.Conv2d(channels, channels,
                               kernel_size=3, padding=1)
        self.conv2 = nn.Conv2d(channels, channels,
                               kernel_size=3, padding=1)
        self.conv3 = nn.Conv2d(channels, channels,
                               kernel_size=1)

    def forward(self, x):
        y = F.relu(self.conv1(x))
        y = self.conv2(x)
        z = self.conv3(x) + y
        return F.relu(z)

输出：

[1,   300] loss: 0.686
[1,   600] loss: 0.192
[1,   900] loss: 0.137
Accuracy on test  set: 96 %
[2,   300] loss: 0.105
[2,   600] loss: 0.093
[2,   900] loss: 0.078
Accuracy on test  set: 98 %
[3,   300] loss: 0.073
[3,   600] loss: 0.065
[3,   900] loss: 0.060
Accuracy on test  set: 98 %
[4,   300] loss: 0.054
[4,   600] loss: 0.049
[4,   900] loss: 0.056
Accuracy on test  set: 98 %
[5,   300] loss: 0.042
[5,   600] loss: 0.048
[5,   900] loss: 0.040
Accuracy on test  set: 98 %
[6,   300] loss: 0.041
[6,   600] loss: 0.039
[6,   900] loss: 0.037
Accuracy on test  set: 98 %
[7,   300] loss: 0.034
[7,   600] loss: 0.033
[7,   900] loss: 0.035
Accuracy on test  set: 98 %
[8,   300] loss: 0.029
[8,   600] loss: 0.030
[8,   900] loss: 0.031
Accuracy on test  set: 98 %
[9,   300] loss: 0.025
[9,   600] loss: 0.027
[9,   900] loss: 0.028
Accuracy on test  set: 98 %
[10,   300] loss: 0.023
[10,   600] loss: 0.026
[10,   900] loss: 0.026
Accuracy on test  set: 98 %
[96.42, 98.2, 98.48, 98.7, 98.9, 98.89, 98.92, 98.99, 98.68, 98.97]

作业2：阅读论文 Densely Connected Convolutional Networks

怎么实现？

5、建议学习流程

理解网络模型理论看花书《动手学深度学习》。
阅读pytorch文档(至少通读一遍)，知道提供了什么功能以及文档结构。
复现经典工作，不是跑通代码，是先去读代码，学习架构；然后尝试自己来写，如此往复。
选特定研究领域，融会贯通，扩充视野，广泛阅读(前提是拥有前面的能力，看到论文，可以反映出代码怎么写，需要慢慢地积累)。

Original: https://blog.csdn.net/qq_44948213/article/details/126820242
Author: 小白*进阶ing
Title: 刘二大人 PyTorch深度学习实践笔记 P11 卷积神经网络（高级篇）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/708185/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

FCM公式详细推及代码

FCM作为一种模糊聚类的方法，依靠的是概率来进行聚类的，它的准则函数是：J = Σ j = 1 C Σ i = 1 N [ μ j ( x i ) ] b ∣ ∣ x i − m …

人工智能 2023年5月31日
00111
1.1.3. Lasso（套索回归）

1.1.3. Lasso 一、简介首先，Lasso同样是线性回归的一种变体。而文档中指出，它是一种能让参数ω \omega ω稀疏的模型（作用）。它是压缩感知领域的基础（地位），…

人工智能 2023年6月17日
0075
详解关系抽取模型 CasRel

今天来跟大家分享一篇发表在 2020ACL 上的实体关系抽取论文 CasRel。论文名称：《A Novel Cascade Binary Tagging Framework f…

人工智能 2023年6月10日
00174
制作数据集—labelImg和labelme

labelImg 首先安装labelImg在Ancconda环境中 pip install labelImg即可然后直接在conda环境中运行 labelImg即可打开软件、软件非…

人工智能 2023年7月3日
0099
为什么禁止MyBatis批量插入几千条数据使用foreach？

近日，项目中有一个耗时较长的Job存在CPU占用过高的问题，经排查发现，主要时间消耗在往MyBatis中批量插入数据。mapper configuration是用foreach循环…

人工智能 2023年6月30日
0044
如何用Python读写Excel文件

目录前言从文件读数据 * 读取xls文件 – 打开工作簿获取工作表读取行读取列读取单元格读取xlsx文件 – 打开工作簿获取工作表读取行数…

人工智能 2023年7月3日
0068
关于秋招的一些小感悟

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月26日
0067
python计算机视觉– 基于OpenCV的图像分割和图像融合系统

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月20日
0079
【亲测通过】MaskRcnn_tf1.x如何升级到MaskRcnn_tf2.x，实现RTX3090环境训练自定义数据集模型。

一、背景: 之前一篇博文中已经实现了maskrcnn_tf1.15.0环境的win10+cpu模型训练，但cpu训练实在是非常的耗时，据说tf1.x是支持RTX1060的（本人未测…

人工智能 2023年7月9日
0064
基于Pytorch的cifar-10图像分类问题代码实现

之前在学习深度学习图片分类任务的时候，跟着老师的讲解实现了一个Cifair-10的图像分类任务。数据集地址：网盘地址需要解码。数据有50000张训练图片和10000张测试图片。下…

人工智能 2023年6月20日
0079
ex1-linearRegression

在本练习中，您将实现线性回归并了解其在数据上的工作原理。在开始练习前，需要下载如下的文件进行数据上传： ex1data1.txt -单变量的线性回归数据集 ex1data2….

人工智能 2023年6月16日
0068
Android版OpenCV图像处理技术亲自验证[三]之斑点检测ColorBlobDetector

结合以前功能点做一个特征点绘制实现步骤图片灰度化高斯滤波二值化图片腐蚀图片膨胀斑点检测绘制特征点前五个已经在前几章说过了，在这就不再说了，有不明白的可以回去看一下…

人工智能 2023年6月22日
0070
分享本周所学——人工智能语音识别模型CTC、RNN-T、LAS详解

本人是一名人工智能初学者，最近一周学了一下AI语音识别的原理和三种比较早期的语音识别的人工智能模型，就想把自己学到的这些东西都分享给大家，一方面想用浅显易懂的语言让大家对这几个模型…

人工智能 2023年6月16日
00102
python学习笔记12：t分布、f分布和卡方分布曲线绘制及临界值和p值计算

首先介绍scipy中的几类函数：概率密度函数(PDF: Probability Density Function)：连续随机变量的概率分布特性用概率密度函数(PDF: Proba…

人工智能 2023年6月19日
00137
JavaWeb项目—— 博客系统

文章目录效果展示 * 1. 创建 maven 项目 2. 设计数据库 3. 封装数据库的操作代码 – 3.1 创建 DBUtil 类 3.2 创建 Blog（代表一篇…

人工智能 2023年7月31日
0048
利用yolov7训练自己的数据集； yolov7的安装与使用； yolov7源码解读

免责声明:1\此方法仅提供参考2\搬了其他博主的操作方法,以贴上路径.3* 场景一:Anconda环境基本操作场景二:yolov7的使用场景三:yolov7训练自己的数据集场…

人工智能 2023年5月31日
0094

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

刘二大人 PyTorch深度学习实践 笔记 P11 卷积神经网络（高级篇）

刘二大人 PyTorch深度学习实践 笔记 P11 卷积神经网络（高级篇）

I 网络结构

; II 减少代码冗余思想(减少代码重复)

I 基本概念

; III 代码实现

II Stack Layer

I 普通网络与残差网络的区别

; II Residual block

III 代码实现

作业1：阅读论文 Identity Mappings in Deep Residual Networks

; 实现 constant scaling

实现conv shortcut

大家都在看

刘二大人 PyTorch深度学习实践笔记 P11 卷积神经网络（高级篇）

刘二大人 PyTorch深度学习实践笔记 P11 卷积神经网络（高级篇）