实战：利用pytorch搭建VGG-16实现从数据获取到模型训练的猫狗分类网络

2023年7月1日上午5:09 • 人工智能 • 阅读 93

起

在学习了卷积神经网络的理论基础和阅读了VGG的论文之后，对卷积有了大致的了解，但这都只是停留在理论上，动手实践更为重要，于是便开始了0基础学习pytorch、图像处理,搭建模型。
pytorch学习视频 https://www.bilibili.com/video/BV1hE411t7RN
代码参考https://blog.csdn.net/aa330233789/article/details/106411301
数据集来源https://www.cnblogs.com/xiximayou/p/12372969.html

悟

收获最大的是对于pycharm的了解更进一步，利用help 和 ?? 在python console 中查看帮助文档，是一个很实用的技巧，并且这也是离线操作，不会就查，函数的参数、参数的含义、数学原理等等一应俱全，配上Makedown的编辑器，绝了。
惊讶于pytorch的封装能力，就从一个BP函数来说，简单的几个参数，包含了L 2 L^2 L 2正则化(权重衰减)、动态学习率调整，对于一个萌新来说，大概连原理也不要明白，只需要知道参数的作用便可以搭建网络。
实际上这个实战还有很多地方没有完善，比如数据增强部分，数据可视化，模型的训练(没算力啥也不是)，还有很多地方值得进一步挖掘。
整体搭建一个类似的项目，虽然伤眼睛、废手，收获确实很大，对于Pytorch的理解比上一个星期的视频可要来得深刻，当然如果想要深入学习pytorch那又是另一个问题。

话不多说，细节全在注释中。
show the code
read_data.py

from torch.utils.data import Dataset
import cv2
import os
import numpy as np
import torch
from torchvision import transforms
class Mydata(Dataset):

    def __init__(self,img_path):
        self.img_path=img_path
        self.img_list=os.listdir(img_path)
        print(self.img_list[0])

    def __getitem__(self, idx):
        img_name = self.img_list[idx]
        img_item_path = os.path.join(self.img_path,img_name)
        img = cv2.imread(img_item_path)
        img = cv2.resize(img,(224,224),interpolation=cv2.INTER_LINEAR)

        trans = transforms.ToTensor()
        img = trans(img)

        label = 0
        if img_name[0]=='c':
            label=1
        return img,label

    def __len__(self):
        return len(self.img_list)

model

from torch import nn

class VGG16Net(nn.Module):
    def __init__(self):
        super(VGG16Net,self).__init__()
        '''
        如果不用super，每次调用父类的方法是需要使用父类的名字
        使用super就避免这个麻烦
        super()实际上的含义远比这个要复杂。
        有兴趣可以通过这篇博客学习：https://blog.csdn.net/zhangjg_blog/article/details/83033210
        '''
        '''
        A sequential container.

        Modules will be added to it in the order they are passed in the
        constructor. Alternatively, an  of modules can be
        passed in. The () method of  accepts any
        input and forwards it to the first module it contains. It then
        "chains" outputs to inputs sequentially for each subsequent module,
        专业术语：一个有序的容器，神经网络模块将按照在传入构造器的顺序依次被添加到计算图中执行，同时以神经网络模块为元素的有序字典也可以作为传入参数
        这是一个有序模型容器，输入会按照顺序逐层通过每一模型，最终会返回最后一个模型的输出。
        实现原理：利用for循环 将所有的参数(即子模块)加入到self._module,然后在__call__中调用forward()，
        而forward()函数则会将self.module中的子模块推理一遍，返回值也就是最终结果。
        参考博客：https://blog.csdn.net/dss_dssssd/article/details/82980222
        '''

        self.layer1 = nn.Sequential(

            nn.Conv2d(3,64,3,padding=1),

            nn.BatchNorm2d(64),

            nn.ReLU(inplace=True),

            nn.Conv2d(64,64,3,padding=1),
            nn.BatchNorm2d(64),
            nn.ReLU(inplace=True),

            nn.MaxPool2d(kernel_size=2,stride=2)
        )

        self.layer2 = nn.Sequential(

            nn.Conv2d(64,128,3,padding=1),
            nn.BatchNorm2d(128),
            nn.ReLU(inplace=True),

            nn.Conv2d(128,128,3,padding=1),
            nn.BatchNorm2d(128),
            nn.ReLU(inplace=True),

            nn.MaxPool2d(kernel_size=2,stride=2)
        )

        self.layer3 = nn.Sequential(

            nn.Conv2d(128,256,3,padding=1),
            nn.BatchNorm2d(256),
            nn.ReLU(inplace=True),

            nn.Conv2d(256, 256, 3, padding=1),
            nn.BatchNorm2d(256),
            nn.ReLU(inplace=True),

            nn.Conv2d(256, 256, 3, padding=1),
            nn.BatchNorm2d(256),
            nn.ReLU(inplace=True),

            nn.MaxPool2d(kernel_size=2,stride=2)
        )

        self.layer4=nn.Sequential(

            nn.Conv2d(256,512,3,padding=1),
            nn.BatchNorm2d(512),
            nn.ReLU(inplace=True),

            nn.Conv2d(512, 512, 3, padding=1),
            nn.BatchNorm2d(512),
            nn.ReLU(inplace=True),

            nn.Conv2d(512, 512, 3, padding=1),
            nn.BatchNorm2d(512),
            nn.ReLU(inplace=True),

            nn.MaxPool2d(kernel_size=2,stride=2)
        )

        self.layer5=nn.Sequential(

            nn.Conv2d(512,512,3,padding=1),
            nn.BatchNorm2d(512),
            nn.ReLU(inplace=True),

            nn.Conv2d(512, 512, 3, padding=1),
            nn.BatchNorm2d(512),
            nn.ReLU(inplace=True),

            nn.Conv2d(512, 512, 3, padding=1),
            nn.BatchNorm2d(512),
            nn.ReLU(inplace=True),

            nn.MaxPool2d(kernel_size=2,stride=2)
        )

        self.conv_layer = nn.Sequential(
            self.layer1,
            self.layer2,
            self.layer3,
            self.layer4,
            self.layer5
        )

        self.fc = nn.Sequential(

            nn.Linear(25088,4096),
            nn.ReLU(inplace=1),
            nn.Dropout(),

            nn.Linear(4096,4096),
            nn.ReLU(inplace=1),
            nn.Dropout(),

            nn.Linear(4096,1000)
        )
    def forward(self,x):
        x = self.conv_layer(x)

        x=x.view(-1,25088)
        x=self.fc(x)
        return x

train.py

import torch
from read_data import Mydata
from torch.utils.data import DataLoader
from torch import nn
from torch import optim
from model import VGG16Net
import time

batch_size  = 8
learn_rate = 0.01
step_size = 10
epuch_num = 1
num_print = 10

mydata = Mydata(r"D:\machine learning\deep learning\VGG16\data\train")

train_loader = torch.utils.data.DataLoader(mydata,batch_size=batch_size,shuffle=True,drop_last=True)

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

model = VGG16Net().to(device=device)

get_loss = nn.CrossEntropyLoss()

'''
这一行代码里面实际上包含了多种优化:
一个是动量优化,增加了一个关于上一次迭代得到的系数的偏置，借助上一次的指导，减小梯度震荡，加快收敛速度
一个是权重衰减，通过对权重增加一个(正则项),该正则项会使得迭代公式中的权重按照比例缩减，这么做的原因是，过拟合的表现一般为参数浮动大，使用小参数可以防止过拟合
'''
optimizer = optim.SGD(model.parameters(),lr=learn_rate,momentum=0.8,weight_decay=0.001)

scheduler = optim.lr_scheduler.StepLR(optimizer,step_size=step_size,gamma=0.5,last_epoch=-1)

loss_list=[]
start=time.time()

for epoch in range(epuch_num):
    running_loss = 0.0

    for i,(inputs,labels) in enumerate(train_loader,0):
        inputs,labels = inputs.to(device), labels.to(device)

        optimizer.zero_grad()
        outputs = model(inputs)
        loss = get_loss(outputs,labels).to(device)

        loss.backward()
        optimizer.step()

        running_loss += loss.item()
        loss_list.append(loss.item())

        if i % num_print == num_print - 1:
            print('[%d epoch, %d] loss: %.6f' % (epoch + 1, i + 1, running_loss / num_print))
            running_loss = 0.0
    lr = optimizer.param_groups[0]['lr']
    print('learn_rate : %.15f'% lr)
    scheduler.step()

end = time.time()
print('time:{}'.format(end-start))

torch.save(model,'./model.pth')

test.py

import torch
from read_data import Mydata
from torch.utils.data import DataLoader
from torch import nn
from torch import optim
from model import VGG16Net

testdata = Mydata(r'D:\machine learning\deep learning\VGG16\data\test\test')
test_loader = torch.utils.data.DataLoader(testdata,batch_size=1,shuffle=False)

device = torch.device('cpu')
model = torch.load('./model.pth')

model.eval()
correct = 0.0
total = 0
with torch.no_grad():
    for input, label in test_loader:
        inputs = input.to(device)
        outputs = model(inputs)
        pred = outputs.argmax(dim=1 )
        total += inputs.size(0)
        correct += torch.eq(pred,label).sum().item()
print('Accuracy of the network on the 10000 test images:%.2f%%'%(100.0*correct/total))
print(total)

ps:其实还有很多问题比如作者在训练是采用贪心式的预训练，如何借助pytorch框架完成，在test.py代码中也存在一些问题。
VGG网络简单、有效，不知道resnet的残差又是怎样的风景。

续：为了验证该网络的有效性，我从kaggle中拿到了猫狗的数据集进行尝试

数据集来源Kaggle : Using a Convolutional Neural Network for classifying Cats vs Dogs

可以看出训练在有效进行，但可能是学习率等超参数的问题呢，训练loss的跳动过大。

Original: https://blog.csdn.net/m0_52186223/article/details/122549898
Author: NONE-C
Title: 实战：利用pytorch搭建VGG-16实现从数据获取到模型训练的猫狗分类网络

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/662737/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

如何在自己的电脑上复现开源论文里的代码

如何在自己的电脑上复现开源论文里的代码刚开始入门科研的小伙伴们总是苦于开源论文中的代码无法在自己的电脑上复现，接下来以文章High speed and high dynamic …

人工智能 2023年6月16日
00376
Python简单数据清洗

我们从网上爬取好的数据，看起来会很乱，我们需要对数据进行再次加工，筛选出我们需要的数据，此时就需要对数据进行清洗。首先我们需要以下从几个方面判断我们需要清洗的数据： 1、数据的完…

人工智能 2023年6月19日
0081
实体对齐算法_融合语义和结构信息的知识图谱实体对齐

融合语义和结构信息的知识图谱实体对齐苏佳林 1,2, 王元卓 1*, 靳小龙李曼玲程学旗实体对齐能够发现不同知识图谱实体间的对齐关系是多源知识融合的基础。现有的基于知识…

人工智能 2023年6月10日
0085
bp神经网络预测模型原理,神经网络模型怎么预测

如何建立bp神经网络预测模型。建立BP神经网络预测模型，可按下列步骤进行：1、提供原始数据2、训练数据预测数据提取及归一化3、BP网络训练4、BP网络预测5、结果分析现用一个…

人工智能 2023年6月16日
0073
KERL A Knowledge-Guided Reinforcement Learning Modelfor Sequential Recommendation

KERL: A Knowledge-Guided Reinforcement Learning Modelfor Sequential Recommendation 记录个人论文学…

人工智能 2023年6月1日
0085
opencv中自适应阈值（adaptiveThreshold()函数）介绍

自适应阈值简介自适应阈值（adaptiveThreshold()，用于二值化处理图像，对于对比大的图像有较好效果，相对于opencv中固定阈值化操作（threshold()），自…

人工智能 2023年7月18日
0045
更快，更强的.NET 7 发布了

.NET Conf 2022 在昨晚(11月8日) 11 点正式开始了，为期三天的会议（11月8-10日），围绕 .NET 7 展开。相信各位小伙伴都已经开始安装 .NET …

人工智能 2023年6月29日
00104
ChatGPT与搜索引擎合体，谷歌都不香了，LeCun转发｜在线可玩

Alex Pine 发自凹非寺量子位 | 公众号 QbitAI 有人脑洞大开，把艳惊四座的ChatGPT和必应搜索结合起来，搞出了一个智能搜索引擎：既有ChatGPT式的问…

人工智能 2023年7月31日
0080
趋势预测方法（四）高斯过程回归_时序概率性预测

高斯过程回归(GPR) a基本原理：利用高斯过程回归将可能的数据趋势曲线都保存下来（每条趋势曲线都有自己的置信度，在区间内呈高斯分布），最后在一张图中显示出来，再判断总体的趋势情…

人工智能 2023年6月17日
00104
使用pandas对超大csv文件进行快速拆分

文章目录前言 1. 操作步骤 * 1.1 安装pandas 1.2 拆分大文件 2. 再多了解一点儿 * 2.1 pandas读取csv文件后，返回的是什么类型？ 2.2 如何从…

人工智能 2023年7月15日
0097
需求-数据资源管理平台

context 大数定理告诉我们，在试验不变的条件下，重复试验多次，随机事件的频率近似于它概率。”有规律的随机事件”在大量重复出现的条件下，往往呈现几乎必然…

人工智能 2023年7月17日
0072
No module named ‘torch_geometric‘解决办法

写在前面 1 不能简单的直接pip install torch_geometric或者 conda install torch_geometric2 直接安装，到后面调用的时候还是…

人工智能 2023年7月21日
0081
【Python中应用Winsorize缩尾处理的心得】

最近搞数据时发现，缩尾时本来是空值或者无效值的地方被填补了数据。传统的研究会将空值剔除后再进行缩尾，但一些不需要剔除空值的数据集需要剔除极端值，因而不能省略缩尾。结合自己的操作经验…

人工智能 2023年6月19日
0098
【ACL2022】有关dialogue论文的汇总

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月27日
0073
Python：ModuleNotFoundError错误解决

前言：大家都知道python项目中需要导入各种包（这里的包引鉴于java中的），官话来讲就是Module。而什么又是Module呢，通俗来讲就是一个模块，当然模块这个意思百度搜…

人工智能 2023年7月5日
0081
nnUNet实战(一)：CREMI挑战赛简单实践

nnUNet实战文章目录 nnUNet实战一、云服务器租赁二、nnUNet安装 * 1.前期准备(文件目录、环境检查) 2.安装nnUNet 3.数据整理三、简单实践 * …

人工智能 2023年7月13日
00145

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

实战：利用pytorch搭建VGG-16实现从数据获取到模型训练的猫狗分类网络

大家都在看