基于Pytorch实现猫狗分类

2023年7月22日下午12:27 • 人工智能 • 阅读 44

导入相应的库


import torch.nn.functional as F
import torch.optim as optim
import torch
import torch.nn as nn
import torch.nn.parallel

import torch.optim
import torch.utils.data
import torch.utils.data.distributed
import torchvision.transforms as transforms
import torchvision.datasets as datasets

设置超参数


BATCH_SIZE = 20

EPOCHS = 10

DEVICE = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

图像处理与图像增强


transform = transforms.Compose([
    transforms.Resize(100),
    transforms.RandomVerticalFlip(),
    transforms.RandomCrop(50),
    transforms.RandomResizedCrop(150),
    transforms.ColorJitter(brightness=0.5, contrast=0.5, hue=0.5),
    transforms.ToTensor(),
    transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])
])

读取数据集和导入数据


dataset_train = datasets.ImageFolder('E:\\Cat_And_Dog\\kaggle\\cats_and_dogs_small\\train', transform)

print(dataset_train.imgs)

print(dataset_train.class_to_idx)

dataset_test = datasets.ImageFolder('E:\\Cat_And_Dog\\kaggle\\cats_and_dogs_small\\validation', transform)

print(dataset_test.class_to_idx)

train_loader = torch.utils.data.DataLoader(dataset_train, batch_size=BATCH_SIZE, shuffle=True)

test_loader = torch.utils.data.DataLoader(dataset_test, batch_size=BATCH_SIZE, shuffle=True)

定义网络模型


class ConvNet(nn.Module):
    def __init__(self):
        super(ConvNet, self).__init__()
        self.conv1 = nn.Conv2d(3, 32, 3)
        self.max_pool1 = nn.MaxPool2d(2)
        self.conv2 = nn.Conv2d(32, 64, 3)
        self.max_pool2 = nn.MaxPool2d(2)
        self.conv3 = nn.Conv2d(64, 64, 3)
        self.conv4 = nn.Conv2d(64, 64, 3)
        self.max_pool3 = nn.MaxPool2d(2)
        self.conv5 = nn.Conv2d(64, 128, 3)
        self.conv6 = nn.Conv2d(128, 128, 3)
        self.max_pool4 = nn.MaxPool2d(2)
        self.fc1 = nn.Linear(4608, 512)
        self.fc2 = nn.Linear(512, 1)

    def forward(self, x):
        in_size = x.size(0)
        x = self.conv1(x)
        x = F.relu(x)
        x = self.max_pool1(x)
        x = self.conv2(x)
        x = F.relu(x)
        x = self.max_pool2(x)
        x = self.conv3(x)
        x = F.relu(x)
        x = self.conv4(x)
        x = F.relu(x)
        x = self.max_pool3(x)
        x = self.conv5(x)
        x = F.relu(x)
        x = self.conv6(x)
        x = F.relu(x)
        x = self.max_pool4(x)

        x = x.view(in_size, -1)
        x = self.fc1(x)
        x = F.relu(x)
        x = self.fc2(x)
        x = torch.sigmoid(x)
        return x

modellr = 1e-4

model = ConvNet().to(DEVICE)

optimizer = optim.Adam(model.parameters(), lr=modellr)

调整学习率

def adjust_learning_rate(optimizer, epoch):

    """Sets the learning rate to the initial LR decayed by 10 every 30 epochs"""
    modellrnew = modellr * (0.1 ** (epoch // 5))
    print("lr:",modellrnew)
    for param_group in optimizer.param_groups:
        param_group['lr'] = modellrnew

定义训练过程


def train(model, device, train_loader, optimizer, epoch):

    model.train()
    for batch_idx, (data, target) in enumerate(train_loader):

        data, target = data.to(device), target.to(device).float().unsqueeze(1)

        optimizer.zero_grad()

        output = model(data)

        loss = F.binary_cross_entropy(output, target)

        loss.backward()

        optimizer.step()

        if (batch_idx + 1) % 10 == 0:

            print('Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(

                epoch, (batch_idx + 1) * len(data), len(train_loader.dataset),

                    100. * (batch_idx + 1) / len(train_loader), loss.item()))

def val(model, device, test_loader):

    model.eval()

    test_loss = 0

    correct = 0

    with torch.no_grad():

        for data, target in test_loader:

            data, target = data.to(device), target.to(device).float().unsqueeze(1)

            output = model(data)

            test_loss += F.binary_cross_entropy(output, target, reduction='mean').item()
            pred = torch.tensor([[1] if num[0] >= 0.5 else [0] for num in output]).to(device)
            correct += pred.eq(target.long()).sum().item()

        print('\nTest set: Average loss: {:.4f}, Accuracy: {}/{} ({:.0f}%)\n'.format(
            test_loss, correct, len(test_loader.dataset),
            100. * correct / len(test_loader.dataset)))

定义保存模型和训练


for epoch in range(1, EPOCHS + 1):

    adjust_learning_rate(optimizer, epoch)
    train(model, DEVICE, train_loader, optimizer, epoch)
    val(model, DEVICE, test_loader)

torch.save(model, 'E:\\Cat_And_Dog\\kaggle\\model.pth')

准备预测的图片
进行测试

from __future__ import print_function, division
from PIL import Image

from torchvision import transforms
import torch.nn.functional as F

import torch
import torch.nn as nn
import torch.nn.parallel

class ConvNet(nn.Module):
    def __init__(self):
        super(ConvNet, self).__init__()
        self.conv1 = nn.Conv2d(3, 32, 3)
        self.max_pool1 = nn.MaxPool2d(2)
        self.conv2 = nn.Conv2d(32, 64, 3)
        self.max_pool2 = nn.MaxPool2d(2)
        self.conv3 = nn.Conv2d(64, 64, 3)
        self.conv4 = nn.Conv2d(64, 64, 3)
        self.max_pool3 = nn.MaxPool2d(2)
        self.conv5 = nn.Conv2d(64, 128, 3)
        self.conv6 = nn.Conv2d(128, 128, 3)
        self.max_pool4 = nn.MaxPool2d(2)
        self.fc1 = nn.Linear(4608, 512)
        self.fc2 = nn.Linear(512, 1)

    def forward(self, x):
        in_size = x.size(0)
        x = self.conv1(x)
        x = F.relu(x)
        x = self.max_pool1(x)
        x = self.conv2(x)
        x = F.relu(x)
        x = self.max_pool2(x)
        x = self.conv3(x)
        x = F.relu(x)
        x = self.conv4(x)
        x = F.relu(x)
        x = self.max_pool3(x)
        x = self.conv5(x)
        x = F.relu(x)
        x = self.conv6(x)
        x = F.relu(x)
        x = self.max_pool4(x)

        x = x.view(in_size, -1)
        x = self.fc1(x)
        x = F.relu(x)
        x = self.fc2(x)
        x = torch.sigmoid(x)
        return x

model_save_path = 'E:\\Cat_And_Dog\\kaggle\\model.pth'

transform_test = transforms.Compose([
    transforms.Resize(100),
    transforms.RandomVerticalFlip(),
    transforms.RandomCrop(50),
    transforms.RandomResizedCrop(150),
    transforms.ColorJitter(brightness=0.5, contrast=0.5, hue=0.5),
    transforms.ToTensor(),
    transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])
])

class_names = ['cat', 'dog']

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

model = torch.load(model_save_path)
model.eval()

image_PIL = Image.open('E:\\Cat_And_Dog\\kaggle\\cats_and_dogs_small\\test\\cats\\cat.1500.jpg')

image_tensor = transform_test(image_PIL)

image_tensor.unsqueeze_(0)

image_tensor = image_tensor.to(device)

out = model(image_tensor)
pred = torch.tensor([[1] if num[0] >= 0.5 else [0] for num in out]).to(device)
print(class_names[pred])

预测结果

从实际训练的过程来看，整体看准确度不高。而经过测试发现，该模型只能对于猫进行识别，对于狗则会误判。

Original: https://blog.csdn.net/qq_43279579/article/details/117606669
Author: HarrietLH
Title: 基于Pytorch实现猫狗分类

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/709003/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

图像处理之小波变换的应用

部分常用的小波变换函数 dwt2： *实现一级二维离散小波变换 [ca,ch,cv,cd] = dwt2(Image, ‘wavename’); % Image: 待分解图像 % …

人工智能 2023年6月20日
0069
使用 CLIP 对没有标记的图像进行零样本无监督分类

深度图像分类模型通常以监督方式在大型带注释数据集上进行训练。随着更多带注释的数据加入到训练中，模型的性能会提高，但用于监督学习的大规模数据集的标注成本时非常高的，需要专家注释者花费…

人工智能 2023年5月28日
0077
ESP8266–Arduino开发（环境搭建）

文章目录一、前言二、IDE下载三、IDE安装四、IDE配置ESP8266环境 * 4.1、添加开发板管理器网址 4.2、安装ESP8266库五、开发板测试 * 5.1、选…

人工智能 2023年6月28日
0086
python计算速度和距离_python – 从Pandas.DataFrame中的时间戳位置计算速度

我对Pandas很新,但熟悉Numpy和Python. 假设我有一个X的”Pandas.DataFrame”,Y点(float64)由时间(日期时间)索引,…

人工智能 2023年7月8日
0050
.NET下如何拦截鼠标、键盘消息？Win32NET来帮你

Win32NET是一个Win32API的.NET下封装的类库，包含： 1: 常用win32的API的net封装 2：鼠标、键盘、热键hook钩子模块， 3：模拟键盘输入文字（支持各…

人工智能 2023年6月4日
00156
基于Python决策树算法的学生学习行为数据分析设计报告+代码及数据

资源下载地址：https://download.csdn.net/download/sheziqiong/85709726资源下载地址：https://download.csdn….

人工智能 2023年6月11日
0073
No module named ‘Torch’解决办法

作者：非妃是公主专栏：《python学习》个性签：顺境不惰，逆境不馁，以心制境，万事可成。——曾国藩转载请标明，原文链接：https://blog.csdn.net/myf_66…

人工智能 2023年7月20日
0058
OpenCV(C++)环境配置（windows）

OpenCV(C++)环境配置（windows） 1.下载编译好的库 1.1）点击网站中OpenCV版本的windows，可获得如下.exe文件，注意该网站的版本为releases…

人工智能 2023年6月19日
0094
用Anaconda安装TensorFlow(Windows10)

用Anaconda安装TensorFlow 本部分分为方法一和方法二，方法一是从清华镜像官网下载速度较快，方法二是从GitHub下载，速度较慢(有梯子的建议使用) 1.打开Ana…

人工智能 2023年5月23日
0088
pytorch使用GPU

文章目录 * – + 1.查看GPU状态 + 2.指定GPU + 3.张量与GPU + 4.神经网络指定GPU设备运行 + 5.多GPU训练 + * 5.1 模型并行 …

人工智能 2023年7月26日
0048
简单说from_tensor_slices()函数

from_tensor_slices()函数常用数据处理中，将多个数据特征进行分割并一一对应组合产生新的配对好的数据，一般可用于元组、列表等，见下面代码： import tenso…

人工智能 2023年5月25日
0066
HRNet论文笔记及代码详解

《Deep High-Resolution Representation Learning for Visual Recognition》 0. 前置知识 * 1）图像语义信息理解…

人工智能 2023年5月26日
0075
4、信源编码

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月27日
0062
javaweb eclipse项目环境问题

javaweb 项目环境问题一、jar包 * 1.1 jar包下载路径 1.2 导入jar包的方法二、eclipse环境 * 2.1 eclipse字体大小设置/编码设置 2….

人工智能 2023年6月29日
0084
《模式识别》期末考试考题汇总带答案

目录一、名词解释二、填空题三、简答题四、计算题一、名词解释样本（sample ）：所研究对象的一个个体。样本集（sample set ）：若干样本的集合。类或类别（…

人工智能 2023年7月28日
0063
结构光法的四步相移法求解相位差（matlab代码）

%读入第一组正弦照片 x1=imread(‘C:\Users\Administrator\Desktop\picture\1.png’);x2=imread…

人工智能 2023年6月22日
0054

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

基于Pytorch实现猫狗分类

大家都在看