基于pytorch的CNN猫狗图分

2023年6月20日上午7:26 • 人工智能 • 阅读 104

1.所需模块
2.前提知识
3.CNN简要
4.基本框架
5.代码
.

1.所需的模块

相关的作用在用到的时候单独讲。

import numpy as np
import matplotlib.pyplot as plt
import torch
import os
from PIL import Image
from torch.autograd import Variable
import torch.nn as nn
import torch.nn.functional as F
import torchvision.transforms as transforms
from torch.utils.data import DataLoader as DataLoader
import torch.utils.data

2.前提知识

1.训练集：（training data set）:以下简称 Trset, Trset 类似于为了让计算机记住某些特征，而存储的一些带有标记的数据的一个集合。

2.测试集 : (testing data set ):以下简称 Teset, 用于检测一数据是什么类别的集合。
3.激励函数的作用 （这里不多讲，csdn上面有很多）
4.简单神经网络构架

3.CNN简要：

CNN（Convolutional Neural Networks）， 卷积神经网络，以卷积的基本操作而命名，简单点的主要分3个部分： 输入层（Input）， 卷积层(Conv)， 池化层(Pool), 和全连层(FC)

根据上图：
输入层：根据第一层Conv(Conv1),该层数据一共有3层，故Conc1的输入层是1个3通道的图片，事实也是这样，彩图是3通道（ RGB）（3个feature map）的,灰图则1个通道（1 个 feature map）；并且没每个像素点的范围为[0,255]（像素点）。一般图片的数据形式则是 [h w c] ,其中对应的字母分别为图片的高，宽，通道数。
卷积层：
用于取特征，由卷积核对输入层图像进行卷积操作以提取图像特征。另外：卷积核（下图移动的部分）**：1个卷积核生成1个feature map，即卷积输出的图像通道数与卷积核的个数一致，卷积核的尺寸为(S×S×C×N)，其中C表示卷积核深度，必须与输入层图像的通道数一致。
基于pytorch的CNN猫狗图分

浅显易懂吧

池化层：
主要用于图像下采样，降低图像分辨率，减少区域内图像的特征数。本文用的池化方法为max pooling，max pooling就是在池化核大小区域内选择最大的数值作为输出结果。
池化的演示：

全连层：
用于分类的操作，若卷积后的图像尺寸为(h×w×c)，需分成n类，则全连层的作用为将[h×w×c]的矩阵转换成[n×1]的矩阵。

; 4.基本框架：

准备数据：将数据集中的数据整理成程序代码可识别读取的形式。
搭建网络：利用PyTorch提供的API搭建设计的网络。
训练网络：把1中准备好的数据送入2中搭建的网络中进行训练，获得网络各节点权值参数（model）。
测试网络：导入3中获取的参数，并输入网络一个数据，然后评估网络的输出结果。
代码实现。
代码前言：准备数据之前，先吧同一文件夹下的 data文件准备好，data文件包train 和test文件，其中train 里的文件要命名为 cat(dog).x.jpg ，test里的从0排序就行了。
大概就是这样的：
data文件目录下：

data->test
基于pytorch的CNN猫狗图分

5.代码

getdata的代码如下：

import os
import torch
import torch.utils.data as data
from PIL import Image
import torchvision.transforms as Trans
img_size = 200

tran = Trans.Compose([Trans.Resize(img_size), Trans.CenterCrop([img_size, img_size]), Trans.ToTensor()])

class DogsVSCatsDataset(data.Dataset):
    def __init__(self, mode, dir):
        self.data_size = 0
        self.img_list=[]
        self.img_label =[]
        self.trans=tran
        self.mode =mode

        if self.mode =='train':
            dir += '/train/'
            for file in os.listdir(dir):
                self.img_list.append(dir+file)
                self.data_size += 1
                name = file.split(sep='.')
                label_x =0
                if name[0] =='cat':
                    label_x =1
                self.img_label.append(label_x)

        elif self.mode == 'test':
            dir +='/test/'
            for file in os.listdir(dir):
                self.img_list.append(dir+file)
                self.data_size +=1
                self.img_label.append(2)
        else:
            print("没有这个mode")

    def __getitem__(self,item):
        if self.mode =='train':
            img =Image.open(self.img_list[item])
            label_y = self.img_label[item]
            return self.trans(img), torch.LongTensor([label_y])
        elif self.mode=='test':
            img =Image.open(self.img_list[item])
            return self.trans(img)
        else:
            print("None")
    def __len__(self):
        return self.data_size

network代码如下

：

import torch
import torch.nn.functional as F
import torch.nn as nn
import torch.utils.data as data

class Net(nn.Module):
    def __init__(self):
        super(Net,self).__init__()
        self.conv1 = torch.nn.Conv2d(3, 16,3, padding=1)
        self.conv2 = torch.nn.Conv2d(16, 16, 3,padding=1)

        self.fc1 = torch.nn.Linear(50*50*16, 128)
        self.fc2 = torch.nn.Linear(128, 64)
        self.fc3 = torch.nn.Linear(64,2)

    def forward(self, x):
        x = self.conv1(x)
        x = F.relu(x)
        x = F.max_pool2d(x, 2)

        x =self.conv2(x)
        x = F.relu(x)
        x = F.max_pool2d(x, 2)

        x = x.view(x.size()[0], -1)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)

        return F.softmax(x, dim=1)

上面的代码中，Conv2中的pading等参数作用，可以看看这篇blog

train 代码如下：

from getdata import DogsVSCatsDataset as DVCD
from torch.utils.data import DataLoader as DataLoader
from network import Net
import torch
from torch.autograd import Variable
import torch.nn as nn

dataset_dir = './data/'

model_dir = './model/'
workers = 10
batch_size = 16
lr = 0.001
nepoch = 1

def train():
    datafile = DVCD('train', dataset_dir)
    dataloader = DataLoader(datafile, batch_size=batch_size, shuffle=True, num_workers=workers, drop_last=True)

    print('Dataset loaded! length of train set is {0}'.format(len(datafile)))

    model = Net()

    model = nn.DataParallel(model)
    model.train()

    optimizer = torch.optim.Adam(model.parameters(), lr=lr)

    Lossfuc = torch.nn.CrossEntropyLoss()

    cnt = 0
    for epoch in range(nepoch):
        for img, label in dataloader:
            img, label = Variable(img), Variable(label)
            out = model(img)
            loss = Lossfuc(out, label.squeeze())
            loss.backward()
            optimizer.step()
            optimizer.zero_grad()
            cnt += 1

            print('Epoch:{0},Frame:{1}, train_loss {2}'.format(epoch, cnt*batch_size, loss/batch_size))
    torch.save(model.state_dict(), '{0}/model.pth'.format(model_dir))
if __name__ == '__main__':
    train()

test 的代码如下：

from getdata import DogsVSCatsDataset as DVCD
from network import Net
from torch.autograd import Variable
import numpy as np
import torch.nn.functional as F
import torch
import torch.nn as nn
import matplotlib.pyplot as plt
from PIL import Image
import os
os.environ["KMP_DUPLICATE_LIB_OK"] = "TRUE"

data_dir = './data/'
model_file = './model/model.pth'
N = 10

model =Net()
model = nn.DataParallel(model)
model.load_state_dict(torch.load(model_file))
model.eval()

datafile = DVCD('test', data_dir)

index = np.random.randint(0, datafile.data_size, 1)[0]
img = datafile.__getitem__(index)

img = img.unsqueeze(0)
img = Variable(img)

out =model(img)
out = F.softmax(out, dim=1)
print(out.data)
if out[0, 0]>out[0, 1]:
    print("the picture is a cat")
else:
    print("the picture is a dog")
img = Image.open(datafile.img_list[index])
plt.figure('image')
plt.imshow(img)
plt.show()

效果图：

mood:

没有谁忘不了谁吧

Original: https://blog.csdn.net/qq_57862276/article/details/124067565
Author: dai _ tu
Title: 基于pytorch的CNN猫狗图分

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/640832/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

回归、拟合、分类的基本概念、常见方法及应用场景

（1）回归：回归：找数据点之间关系的分析方法就是回归。回归算法是一种比较常用的机器学习算法，用来表示自变量X和因变量Y之间的关系。从机器学习的角度，构建一个算法模型来做属性X与标…

人工智能 2023年6月17日
0066
【图神经网络】图神经网络(GNN)学习笔记：图分类

图神经网络GNN学习笔记：图分类 1. 基于全局池化的图分类 2. 基于层次化池化的图分类 * 2.1 基于图坍缩的池化机制 – 1 图坍缩 2 DIFFPOOL 3….

人工智能 2023年7月2日
00175
《移动应用开发技术——Android》课程报告-个人记账系统

《移动应用开发技术》课程报告一、Android应用程序开发背景 * 1.Android开发的背景 2.应用程序的背景二、相关理论与方法 * 1.基本控件 – （1）…

人工智能 2023年7月29日
0070
python数据分析基础之Numpy库详解（一）

Numpy库基础 * – 安装numpy库 – numpy介绍 – Numpy数组对象 – + 创建多维数组 + 获取数组中的元素 …

人工智能 2023年7月17日
0045
ros(23)：接收rviz中的2D Nav Goal、2D Pose Estimate消息

1 rviz 教程 1.1 2D Nav Goal This tool lets you set a goal sent on the “goal” ROS…

人工智能 2023年7月27日
0047
基于空间句法的城市道路可达性分析

本篇推文将为大家介绍如何基于空间句法分析城市道路的可达性，相信大家已经看过小编之前的一篇推文《》，那一篇文章主要基于OD成本矩阵来分析道路可达性。而本文介绍的空间句法更强调空间关系…

人工智能 2023年6月24日
0072
开发者说PaddleOCR的.NET封装与应用部署

posted on2022-02-26 12:02 饶玉田阅读(497 ) 评论() 编辑 Original: https://www.cnblogs.com/raoyutian…

人工智能 2023年6月4日
0097
深度学习基础宝典—激活函数、Batch Size、归一化

🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝🔝🥰 博客首页： knighthood2001😗 欢迎点赞👍评论🗨️❤️ 热爱python，期待与大家一同进步成长！！❤️ 目录👍👍 🕐激活函数常见的激活函…

人工智能 2023年6月13日
0083
GNSS及其定位原理，差分GNSS技术分析

1 GNSS概述根据后方交会定位原理，要实现 GNSS定位，需要解决两个问题:一是观测瞬间卫星的空间位置；二是观测站点和卫星之间的距离，即卫星在某坐标系中的坐标。为此首先要建…

人工智能 2023年6月23日
0082
Origin曲线拟合教程

今天是自我学习的第n天~ 一、线性和多项式拟合（一）线性拟合和异常值去除首先，异常值通常被描述为与其他点”非常遥远”的数据点集合中的数据点或观察值，因此…

人工智能 2023年6月23日
00203
【机器学习算法】聚类分析-2 聚类算法的分类，层次聚类算法的选择

目录聚类算法的分类层次聚类的算法，单一聚类法（single link）完全链结法平均链结法中心链结法Ward’s法我的主页：晴天qt01的博客_CSDN博客-数据分析…

人工智能 2023年6月2日
0099
图像特征提取（VGG和Resnet特征提取卷积过程详解）

图像特征提取（VGG和Resnet算法卷积过程详解）第一章图像特征提取认知 1.1常见算法原理和性能众所周知，计算机不认识图像,只认识数字。为了使计算机能够”理解…

人工智能 2023年5月26日
0069
位置编码（PE）是如何在Transformers中发挥作用的

在人类的语言中，单词的顺序和它们在句子中的位置是非常重要的。如果单词被重新排序后整个句子的意思就会改变，甚至可能变得毫无意义。 Transformers不像LSTM具有处理序列排序…

人工智能 2023年7月14日
0067
31.3 Java进阶之lambda方法引用

文章目录 1.方法引用 * 1.1 复用已有方法传递lambda 1.2 : :操作符 – 1.2.1 object::instanceMethod 1.2.2 Cla…

人工智能 2023年6月26日
0082
【运维】linux shell 编程之函数使用

前言使用linux的shell编程，可以说函数是非常重要的内容，也是在编写各类shell脚本的时候经常用到的，本篇将介绍下函数相关的使用。 shell 函数分类系统函数自定义…

人工智能 2023年6月19日
0071
无监督学习——K均值聚类（上）

序近几年在机器学习领域里面，聚类是比较热门的一个词汇。它是将数据集划分成组的任务，这些组叫做簇。其目标是划分数据，使得一个簇内的数据点非常相似且簇内的数据点非常不同。与分类算…

人工智能 2023年6月3日
0081

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31