卷积神经网络实现图像识别

2023年7月5日上午9:28 • 人工智能 • 阅读 72

卷积神经网络实现图像识别

*
– 项目简介
– 项目效果展示
– 程序运行流程图
– 代码使用说明
– 数据集准备
–
+ 训练集
+ 测试集
– 搭建神经网络
– 训练函数
– 测试函数
– 模型-训练过程完整代码
–
+ 模型保存使用的是torch.save(model，src),model即须保存的模型，src即模型保存的位置，后缀为pth
– 模型-调用完整代码
–
+ 模型调用使用，torch.load(src)
– 注

项目简介

目的： 实现昆虫的图像分类，同时该模型也可以用于其他图像的分类识别，只需传入相应的训练集进行训练，保存为另一个模型即可，进行调用使用。
配置环境： pycharm（python3.7），导入pytotch库
知识预备： 需要了解卷积神经网络的基本原理与结构，熟悉pytorch的使用，csdn有很多介绍卷积神经网络的文章，可查阅。
例如：

https://blog.csdn.net/yunpiao123456/article/details/52437794
https://blog.csdn.net/weipf8/article/details/103917202

算法设计思路：
（1）收集数据集，利用 python 的 requests 库和 bs4 进行网络爬虫，下载数据集
（2）搭建卷积神经网络
（3）对卷积神经网络进行训练
（4）改进训练集与测试集，并扩大数据集
（5）保存模型
（6）调用模型进行测试

项目效果展示

注，模型我达到的最高正确率在85%，最后稳定在79%，中间出现了过拟合，可减少训练次数进行优化，数据集较少的情况下，建议训练10次就可。

; 程序运行流程图

代码使用说明

先训练模型，进行模型保存之后可对模型进行调用，不用每使用一次模型就要进行训练。文末有项目的完整代码：修改自己的数据集src位置，一般情况下能正常运行，如果不能，请检查自己的第三方库是否成功安装，以及是否成功导入。若有问题可以私信交流学习。

数据集准备

注：由于爬虫，会有一些干扰数据，所以我这里展示的是进行数据清洗之后的数据。
注：训练集：测试集=7：3（可自己修改）
注：若正确率不理想，可扩大数据集，数据清洗，图片处理等方面进行改进

训练集

部分数据展示

; 测试集

文件格式与训练集一样。

搭建神经网络

框架：

结构：

代码实现：


class ConvNet(nn.Module):
    def __init__(self):
        super(ConvNet, self).__init__()
        self.conv1 = nn.Conv2d(3, 32, 3)
        self.max_pool1 = nn.MaxPool2d(2)
        self.conv2 = nn.Conv2d(32, 64, 3)
        self.max_pool2 = nn.MaxPool2d(2)
        self.conv3 = nn.Conv2d(64, 64, 3)
        self.conv4 = nn.Conv2d(64, 64, 3)
        self.max_pool3 = nn.MaxPool2d(2)
        self.conv5 = nn.Conv2d(64, 128, 3)
        self.conv6 = nn.Conv2d(128, 128, 3)
        self.max_pool4 = nn.MaxPool2d(2)
        self.fc1 = nn.Linear(4608, 512)
        self.fc2 = nn.Linear(512, 1)

    def forward(self, x):
        in_size = x.size(0)
        x = self.conv1(x)
        x = F.relu(x)
        x = self.max_pool1(x)
        x = self.conv2(x)
        x = F.relu(x)
        x = self.max_pool2(x)
        x = self.conv3(x)
        x = F.relu(x)
        x = self.conv4(x)
        x = F.relu(x)
        x = self.max_pool3(x)
        x = self.conv5(x)
        x = F.relu(x)
        x = self.conv6(x)
        x = F.relu(x)
        x = self.max_pool4(x)

        x = x.view(in_size, -1)
        x = self.fc1(x)
        x = F.relu(x)
        x = self.fc2(x)
        x = torch.sigmoid(x)
        return x

训练函数

def train(model, device, train_loader, optimizer, epoch):
    model.train()
    for batch_idx, (data, target) in enumerate(train_loader):

        data, target = data.to(device), target.to(device).float().unsqueeze(1)

        optimizer.zero_grad()

        output = model(data)

        loss = F.binary_cross_entropy(output, target)

        loss.backward()

        optimizer.step()

        if (batch_idx + 1) % 1 == 0:
            print('Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(

                epoch, (batch_idx + 1) * len(data), len(train_loader.dataset),

                       100. * (batch_idx + 1) / len(train_loader), loss.item()))

测试函数

def test(model, device, test_loader):
    model.eval()

    test_loss = 0

    correct = 0

    with torch.no_grad():
        for data, target in test_loader:
            data, target = data.to(device), target.to(device).float().unsqueeze(1)

            output = model(data)

            test_loss += F.binary_cross_entropy(output, target, reduction='mean').item()
            pred = torch.tensor([[1] if num[0] >= 0.5 else [0] for num in output]).to(device)
            correct += pred.eq(target.long()).sum().item()

        print('\nTest set: Average loss: {:.4f}, Accuracy: {}/{} ({:.0f}%)\n'.format(
            test_loss, correct, len(test_loader.dataset),
            100. * correct / len(test_loader.dataset)))

模型-训练过程完整代码

模型保存使用的是torch.save(model，src),model即须保存的模型，src即模型保存的位置，后缀为pth

import torch.nn.functional as F
import torch.optim as optim
import torch
import torch.nn as nn
import torch.nn.parallel
from PIL import Image
import torch.optim
import torch.utils.data
import torch.utils.data.distributed
import torchvision.transforms as transforms
import torchvision.datasets as datasets

BATCH_SIZE = 20

EPOCHS = 10

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

transform = transforms.Compose([
    transforms.Resize(100),
    transforms.RandomVerticalFlip(),
    transforms.RandomCrop(50),
    transforms.RandomResizedCrop(150),
    transforms.ColorJitter(brightness=0.5, contrast=0.5, hue=0.5),
    transforms.ToTensor(),
    transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])
])

dataset_train = datasets.ImageFolder('D:\\cnn_net\\train\\insects', transform)

dataset_test = datasets.ImageFolder('D:\\cnn_net\\train\\test', transform)

test_loader = torch.utils.data.DataLoader(dataset_test, batch_size=BATCH_SIZE, shuffle=True)

classess=dataset_train.classes
class_to_idxes=dataset_train.class_to_idx
print(class_to_idxes)

train_loader = torch.utils.data.DataLoader(dataset_train, batch_size=BATCH_SIZE, shuffle=True)

class ConvNet(nn.Module):
    def __init__(self):
        super(ConvNet, self).__init__()
        self.conv1 = nn.Conv2d(3, 32, 3)
        self.max_pool1 = nn.MaxPool2d(2)
        self.conv2 = nn.Conv2d(32, 64, 3)
        self.max_pool2 = nn.MaxPool2d(2)
        self.conv3 = nn.Conv2d(64, 64, 3)
        self.conv4 = nn.Conv2d(64, 64, 3)
        self.max_pool3 = nn.MaxPool2d(2)
        self.conv5 = nn.Conv2d(64, 128, 3)
        self.conv6 = nn.Conv2d(128, 128, 3)
        self.max_pool4 = nn.MaxPool2d(2)
        self.fc1 = nn.Linear(4608, 512)
        self.fc2 = nn.Linear(512, 1)

    def forward(self, x):
        in_size = x.size(0)
        x = self.conv1(x)
        x = F.relu(x)
        x = self.max_pool1(x)
        x = self.conv2(x)
        x = F.relu(x)
        x = self.max_pool2(x)
        x = self.conv3(x)
        x = F.relu(x)
        x = self.conv4(x)
        x = F.relu(x)
        x = self.max_pool3(x)
        x = self.conv5(x)
        x = F.relu(x)
        x = self.conv6(x)
        x = F.relu(x)
        x = self.max_pool4(x)

        x = x.view(in_size, -1)
        x = self.fc1(x)
        x = F.relu(x)
        x = self.fc2(x)
        x = torch.sigmoid(x)
        return x

modellr = 1e-4

model = ConvNet().to(device)
print(model)

optimizer = optim.Adam(model.parameters(), lr=modellr)

def adjust_learning_rate(optimizer, epoch):
    """Sets the learning rate to the initial LR decayed by 10 every 30 epochs"""
    modellrnew = modellr * (0.1 ** (epoch // 5))
    print("lr:", modellrnew)
    for param_group in optimizer.param_groups:
        param_group['lr'] = modellrnew

def train(model, device, train_loader, optimizer, epoch):
    model.train()
    for batch_idx, (data, target) in enumerate(train_loader):

        data, target = data.to(device), target.to(device).float().unsqueeze(1)

        optimizer.zero_grad()

        output = model(data)

        loss = F.binary_cross_entropy(output, target)

        loss.backward()

        optimizer.step()

        if (batch_idx + 1) % 1 == 0:
            print('Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(

                epoch, (batch_idx + 1) * len(data), len(train_loader.dataset),

                       100. * (batch_idx + 1) / len(train_loader), loss.item()))

def test(model, device, test_loader):
    model.eval()

    test_loss = 0

    correct = 0

    with torch.no_grad():
        for data, target in test_loader:
            data, target = data.to(device), target.to(device).float().unsqueeze(1)

            output = model(data)

            test_loss += F.binary_cross_entropy(output, target, reduction='mean').item()
            pred = torch.tensor([[1] if num[0] >= 0.5 else [0] for num in output]).to(device)
            correct += pred.eq(target.long()).sum().item()

        print('\nTest set: Average loss: {:.4f}, Accuracy: {}/{} ({:.0f}%)\n'.format(
            test_loss, correct, len(test_loader.dataset),
            100. * correct / len(test_loader.dataset)))

for epoch in range(1, EPOCHS + 1):
    adjust_learning_rate(optimizer, epoch)
    train(model, device, train_loader, optimizer, epoch)
    test(model, device, test_loader)

torch.save(model, 'D:\\cnn_net\\datas\\model_insects.pth')

模型-调用完整代码

模型调用使用，torch.load(src)


from PIL import Image

from torchvision import transforms
import torch.nn.functional as F

import torch
import torch.nn as nn
import torch.nn.parallel

class ConvNet(nn.Module):
    def __init__(self):
        super(ConvNet, self).__init__()
        self.conv1 = nn.Conv2d(3, 32, 3)
        self.max_pool1 = nn.MaxPool2d(2)
        self.conv2 = nn.Conv2d(32, 64, 3)
        self.max_pool2 = nn.MaxPool2d(2)
        self.conv3 = nn.Conv2d(64, 64, 3)
        self.conv4 = nn.Conv2d(64, 64, 3)
        self.max_pool3 = nn.MaxPool2d(2)
        self.conv5 = nn.Conv2d(64, 128, 3)
        self.conv6 = nn.Conv2d(128, 128, 3)
        self.max_pool4 = nn.MaxPool2d(2)
        self.fc1 = nn.Linear(4608, 512)
        self.fc2 = nn.Linear(512, 1)

    def forward(self, x):
        in_size = x.size(0)
        x = self.conv1(x)
        x = F.relu(x)
        x = self.max_pool1(x)
        x = self.conv2(x)
        x = F.relu(x)
        x = self.max_pool2(x)
        x = self.conv3(x)
        x = F.relu(x)
        x = self.conv4(x)
        x = F.relu(x)
        x = self.max_pool3(x)
        x = self.conv5(x)
        x = F.relu(x)
        x = self.conv6(x)
        x = F.relu(x)
        x = self.max_pool4(x)

        x = x.view(in_size, -1)
        x = self.fc1(x)
        x = F.relu(x)
        x = self.fc2(x)
        x = torch.sigmoid(x)
        return x

class_names = ['瓢虫','螳螂',]

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

model = torch.load('D:\\cnn_net\\datas\\model_insects.pth')
model.eval()

image_PIL = Image.open('D:\\cnn_net\\train\\insects\\瓢虫\\p49.jpg')

transform_test = transforms.Compose([
    transforms.Resize(100),
    transforms.RandomVerticalFlip(),
    transforms.RandomCrop(50),
    transforms.RandomResizedCrop(150),
    transforms.ColorJitter(brightness=0.5, contrast=0.5, hue=0.5),
    transforms.ToTensor(),
    transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])
    ])

image_tensor = transform_test(image_PIL)

image_tensor.unsqueeze_(0)

image_tensor = image_tensor.to(device)

out = model(image_tensor)

pred = torch.tensor([[1] if num[0] >= 0.5 else [0] for num in out]).to(device)
print(class_names[pred])

注

有错误的地方欢迎大家交流学习，进行指正，一起学习进步。

Original: https://blog.csdn.net/Satenga/article/details/122341233
Author: 是aaaa阿腾阿
Title: 卷积神经网络实现图像识别

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/671502/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

linux 环境异常登录的甄别方法

1、关于linux的登录记录查看最近登录IP和历史命令执行日期 last 显示的最末尾的使用last -10 看最新的登录IP地址时间 still仍在登录选项：（1）-x…

人工智能 2023年7月31日
0047
2D 语义分割——DeepLabV3plus 复现

文章目录语义分割简介 DeepLabV3plus * 模型结构基础知识点模型实现 Backbone 设计实验结果语义分割简介 😸语义分割结合了图像分类、目标检测和图像分割…

人工智能 2023年7月22日
0064
NLP预训练模型系列-GPT-2

NLP预训练模型系列文章目录 BERT GPT GPT-2 GPT-3 目录 NLP预训练模型系列文章目录前言 1. Abstract 2. Introduction 3. A…

人工智能 2023年5月31日
0098
Anaconda中keras、Tensorflow安装血泪史。。。

事情是这样的：由于已有代码是基于tensorflow 1.0版本，与tensorflow不兼容。而安装Anaconda的时候，默认安装最新版本，所以想着先搭建一个新的虚拟环境，再在…

人工智能 2023年5月25日
0072
oracle 的servicename和sid配置url有区别

项目启动执行报错：java.sql.SQLException: Listener refused the connection with the following error:O…

人工智能 2023年6月29日
00103
PaddleDetection目标检测任务简介和概述

本篇博客不计入作业目标检测任务简介目标检测的主要目的是让计算机可以自动识别图片或者视频帧中所有目标的类别，并在该目标周围绘制边界框，标示出每个目标的位置，如下图所示。图（a）是…

人工智能 2023年7月9日
0097
Error: Aesthetics must be either length 1 or the same as the data (5): fill

ERROR while rich displaying an object: Error: Aesthetics must be either length 1 or the sa…

人工智能 2023年6月19日
00113
【配电网】基于MATLAB的Newton-Raphson法电力系统潮流计算

✅作者简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，matlab项目合作可私信。🍎个人主页：Matlab科研工作室🍊个人信条：格物致知。更多Matlab仿真内容点击👇…

人工智能 2023年6月30日
00119
Android 线上卡顿监控

文章目录 * – 1. 卡顿与ANR的关系 – 2. 卡顿原理 – 3. 卡顿监控 – + 3.1 WatchDog + 3.2 L…

人工智能 2023年7月31日
0069
java【毕业设计】项目-第118期基于SpringBoot+LayUI的视频播放网站(权限采用SpringSecurity)-计算机毕业设计

### 回答1： springboot+ layui 项目_是一种基于 _Java_语言和Spring Boot框架的Web应用程序开发模式，它 _采用_了前后端分离的架构，前端使…

人工智能 2023年6月28日
0070
RNA-seq数据分析

一、数据收集 1.NCBI GEO数据库收集相关RNA-seq数据样本信息以及引用文献可以点击对应链接查看 2.SRA Run Selector 查看数据单双端类型（SINGLE …

人工智能 2023年6月25日
00111
数字仪表自动读数（Matlab）

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档由于之前实验室需要通过图片人工读取光强计（数字表）的读数，所以就根据网上的代码自己实现了让matlab自动读取数字…

人工智能 2023年6月22日
00124
Unity架构之详解域重新加载和场景重新加载

一、unity进入运行模式包括以下主要阶段备份当前场景：这仅在场景被修改后发生。这样当退出运行模式时，Unity 将场景恢复为运行模式开始前的状态。 Domain Reload：…

人工智能 2023年7月31日
0079
ubuntu18 CUDA版本降级

用别人的代码训练模型时，由于tensorflow-gpu版本太高，报了很多错，一个个改太麻烦，所以直接降级。tensorflow降级为1.14，与此同时也要换成对应版本的CUDA和…

人工智能 2023年5月23日
0088
【数据分析】分类指标、用户价值与预测—抖音电商数据集

该数据集(douyin.csv)主要截取了200000条抖音电商平台上的商品销售情况。本文的分析将先根据数据集的结构选取分析目标，再通过可视化来展示各项分析目标的结果，从而挖掘出影…

人工智能 2023年7月15日
0079
自然场景下特定人工标识的识别

在自然场景下检测并识别出五类特定标识（特定标志是用蓝色A4纸打印）。输入为自然场景下的图像，输出为该图像中该标识对应的数字标号。对于五类之外的样本输出数字0，达到字母识别分类. （…

人工智能 2023年6月11日
00109

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

卷积神经网络实现图像识别

卷积神经网络实现图像识别

项目简介

项目效果展示

; 程序运行流程图

代码使用说明

数据集准备

训练集

; 测试集

搭建神经网络

训练函数

测试函数

模型-训练过程完整代码

模型保存使用的是torch.save(model，src),model即须保存的模型，src即模型保存的位置，后缀为pth

模型-调用完整代码

模型调用使用，torch.load(src)

注

大家都在看