基于pytorch的图像识别基础完整教程

2023年7月21日上午1:26 • 人工智能 • 阅读 46

一、数据集爬取

现在的深度学习对数据集量的需求越来越大了，也有了许多现成的数据集可供大家查找下载，但是如果你只是想要做一下深度学习的实例以此熟练一下或者找不到好的数据集，那么你也可以尝试自己制作数据集——自己从网上爬取图片，下面是通过百度图片爬取数据的示例。

import os
import time
import requests
import re
def imgdata_set(save_path,word,epoch):
    q=0
    a=0
    while(True):
        time.sleep(1)
        url="https://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word={}&pn={}&ct=&ic=0&lm=-1&width=0&height=0".format(word,q)

        headers={
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.96 Safari/537.36 Edg/88.0.705.56'
        }
        response=requests.get(url,headers=headers)

        html=response.text

        urls=re.findall('"objURL":"(.*?)"',html)

        for url in urls:
            print(a)
            response = requests.get(url, headers=headers)
            image=response.content
            with open(os.path.join(save_path,"{}.jpg".format(a)),'wb') as f:
                f.write(image)
            a=a+1
        q=q+20
        if (q/20)>=int(epoch):
            break
if __name__=="__main__":
    save_path = input('你想保存的路径：')
    word = input('你想要下载什么图片？请输入:')
    epoch = input('你想要下载几轮图片？请输入(一轮为60张左右图片):')
    imgdata_set(save_path, word, epoch)

通过上述的代码可以自行选择自己需要保存的图片路径、图片种类和图片数目。如我下面做的几种常见的盆栽植物的图片爬取，只需要执行六次代码，改变相应的盆栽植物的名称就可以了。下面是爬取盆栽芦荟的输入示例，输入完成后按Enter执行即可，会自动爬取图片保存到指定文件夹，

如图即为爬取后的图片。
基于pytorch的图像识别基础完整教程

可以看到图片中出现了一些无法打开的图片，同时因为是直接爬取的网络上的图片，可能会出现一些相同的图片，这些都需要进行删除，这就需要我们进行第二步处理了。

二、数据处理

由于上面直接爬取到的图片有一些瑕疵，这就需要对图片进行进一步的处理了，对图片进行去重处理，可以参考下面链接：
文件夹去除重复图片
通过重复图片去重处理，将自己需要的数据集按照种类分别保存在各自的文件夹里。同样，由于数据集可能存在无法打开的图片，这就需要对数据集进行下一步处理了。
首先将上面去重处理后的文件夹统一保存在同一个文件夹里面，如下图所示。

记住此文件夹路径，我这里是’C:\Users\Lenovo\Desktop\data’，将此路径输入到下面代码中。

import os
from PIL import Image
root_path=r"C:\Users\Lenovo\Desktop\data"
root_names=os.listdir(root_path)

for root_name in root_names:
    path=os.path.join(root_path,root_name)
    print("正在删除文件夹：",path)
    names=os.listdir(path)
    names_path=[]
    for name in names:

        img=Image.open(os.path.join(path,name))
        name_path=os.path.join(path,name)
        if img==None:
            names_path.append(name_path)
            print('成功保存错误图片路径：{}'.format(name))
        else:
            w,h=img.size
            if w<50 or h<50:
                names_path.append(name_path)
                print('成功保存特小图片路径：{}'.format(name))
    print("开始删除需删除的图片")
    for r in names_path:
        os.remove(r)
        print("已删除：",r)

经过上述处理即完成了图片数据集的处理。最后，也可以对图片数据集进行图片名称的处理，使图片的名称重新从零开始依次排列，方便计数（注意下面代码中的rename将会删除掉原文件夹中的图片）。

import os
root_dir=r"C:\Users\Lenovo\Desktop\pzlh"
save_path=r"C:\Users\Lenovo\Desktop\pzlh2"
img_path=os.listdir(root_dir)
a=0
for i in img_path:
    a+=1
    i= os.path.join(os.path.abspath(root_dir), i)
    new_name=os.path.join(os.path.abspath(save_path), str(a) + '_pzlh.jpg')
    os.rename(i,new_name)

最后，我们可以得到一个将完整的常见盆栽植物的数据集。如果此时数据集的图片数量不多，我们还可以采用数据增强的方法，如旋转，加噪等步骤，都可以在网上找到相应的教程。最后，我们可以得到数据集如下图所示。

三、开始识别

首先，先为上面的图片数据集生成对应的标签文件，运行下面代码可以自动生成对应的标签文件。

import os
root_path=r"C:\Users\Lenovo\Desktop\data"
save_path=r"C:\Users\Lenovo\Desktop\data_label"
names=os.listdir(root_path)
for name in names:
    path=os.path.join(root_path,name)
    img_names=os.listdir(path)
    for img_name in img_names:
        save_name = img_name.split(".jpg")[0]+'.txt'
        txt_path=os.path.join(save_path,name)
        with open(os.path.join(txt_path,save_name), "w") as f:
            f.write(name)
            print(f.name)

然后，将上面已经准备好的数据集按照7：3（其他比例也可以）分为训练数据集和验证数据集（图片和标签一定要完全对应即对应图片和标签应该都处于训练集或者数据集），并如下图所示放置。

最后，数据集准备好后，即可导入到模型开始训练，运行下列代码

import time
from torch.utils.tensorboard import SummaryWriter
from torchvision.datasets import ImageFolder
from torchvision import transforms
from torch.utils.data import DataLoader
import torchvision.models as models
import torch.nn as nn
import torch

print("是否使用GPU训练：{}".format(torch.cuda.is_available()))
if torch.cuda.is_available:
    print("GPU名称为：{}".format(torch.cuda.get_device_name()))

normalize=transforms.Normalize(mean=[.5,.5,.5],std=[.5,.5,.5])
transform=transforms.Compose([
    transforms.Resize((64,64)),
    transforms.ToTensor(),
    normalize
])
dataset_train=ImageFolder('data/train',transform=transform)

dataset_valid=ImageFolder('data/valid',transform=transform)

print(dataset_train.class_to_idx)

print(dataset_valid.class_to_idx)
train_data_size=len(dataset_train)
test_data_size=len(dataset_valid)
print("训练数据集的长度为：{}".format(train_data_size))
print("测试数据集的长度为：{}".format(test_data_size))

dataloader_train=DataLoader(dataset_train,batch_size=4,shuffle=True,num_workers=0,drop_last=True)
dataloader_test=DataLoader(dataset_valid,batch_size=4,shuffle=True,num_workers=0,drop_last=True)

model_ft=models.resnet18(pretrained=True)

in_features=model_ft.fc.in_features
model_ft.fc=nn.Sequential(nn.Linear(in_features,36),
                          nn.Linear(36,6))

model_ft=model_ft.cuda()

loss_fn=nn.CrossEntropyLoss()

loss_fn=loss_fn.cuda()
learn_rate=0.01
optimizer=torch.optim.SGD(model_ft.parameters(),lr=learn_rate,momentum=0.01)

total_train_step=0
total_test_step=0
epoch=50
writer=SummaryWriter("logs_train_yaopian")
best_acc=-1
ss_time=time.time()

for i in range(epoch):
    start_time = time.time()
    print("--------第{}轮训练开始---------".format(i+1))
    model_ft.train()
    for data in dataloader_train:
        imgs,targets=data

        imgs=imgs.cuda()
        targets=targets.cuda()

        outputs=model_ft(imgs)
        loss=loss_fn(outputs,targets)

        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        total_train_step=total_train_step+1
        if total_train_step%100==0:
            end_time=time.time()
            print("使用GPU训练100次的时间为：{}".format(end_time-start_time))
            print("训练次数：{},loss:{}".format(total_train_step,loss.item()))

    model_ft.eval()
    total_test_loss=0
    total_accuracy=0
    with torch.no_grad():
        for data in dataloader_test:
            imgs,targets=data

            imgs = imgs.cuda()
            targets = targets.cuda()

            outputs=model_ft(imgs)
            loss=loss_fn(outputs,targets)
            total_test_loss=total_test_loss+loss.item()
            accuracy=(outputs.argmax(1)==targets).sum()
            total_accuracy=total_accuracy+accuracy
        print("整体测试集上的loss：{}(越小越好,与上面的loss无关此为测试集的总loss)".format(total_test_loss))
        print("整体测试集上的正确率：{}(越大越好)".format(total_accuracy / len(dataset_valid)))

        writer.add_scalar("valid_loss",(total_accuracy/len(dataset_valid)),(i+1))
        total_test_step = total_test_step + 1
        if total_accuracy > best_acc:
            print("已修改模型")
            best_acc = total_accuracy
            torch.save(model_ft, "best_model_yaopian.pth")
ee_time=time.time()
zong_time=ee_time-ss_time
print("训练总共用时:{}h:{}m:{}s".format(int(zong_time//3600),int((zong_time%3600)//60),int(zong_time%60)))
writer.close()

上述采用的迁移学习直接使用resnet18的模型进行训练，只对全连接的输出进行修改，是一种十分方便且实用的方法，同样，你也可以自己编写模型，然后使用自己的模型进行训练，但是这种方法显然需要训练更长的时间才能达到拟合。如图所示，只需要修改矩形框内部分，将’model_ft=models.resnet18(pretrained=True)’改为自己的模型’model_ft=model’即可。

四、模型测试

经过上述的步骤后，我们将会得到一个’best_model_yaopian.pth’的模型权重文件，最后运行下列代码就可以对图片进行识别了

import os
import torch
import torchvision
from PIL import Image
from torch import nn
i=0
root_path="测试_data"
names=os.listdir(root_path)
for name in names:
    print(name)
    i=i+1
    data_class=['滴水观音','发财树','非洲茉莉','君子兰','盆栽芦荟','文竹']
    image_path=os.path.join(root_path,name)
    image=Image.open(image_path)
    print(image)
    transforms=torchvision.transforms.Compose([torchvision.transforms.Resize((64,64)),
                                              torchvision.transforms.ToTensor()])
    image=transforms(image)
    print(image.shape)

    model_ft=torchvision.models.resnet18()

    in_features=model_ft.fc.in_features
    model_ft.fc=nn.Sequential(nn.Linear(in_features,36),
                              nn.Linear(36,6))

    model=torch.load("best_model_yaopian.pth",map_location=torch.device("cpu"))

    image=torch.reshape(image,(1,3,64,64))
    model.eval()
    with torch.no_grad():
        output=model(image)
    print(output)

    print("第{}张图片预测为：{}".format(i,data_class[int(output.argmax(1))]))

最后，通过上述步骤我们可以得到一个简单的盆栽植物智能识别程序，对盆栽植物进行识别，如下图是识别结果说明。

到这里，我们就实现了一个简单的深度学习图像识别示例了。

Original: https://blog.csdn.net/m0_60681041/article/details/122890003
Author: @__
Title: 基于pytorch的图像识别基础完整教程

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/706125/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

pytorch_grad_cam——pytorch下的模型特征(Class Activation Mapping, CAM)可视化库

深度学习是一个”黑盒”系统。它通过”end-to-end”的方式来工作，中间过程是不可知的，通过中间特征可视化可以对模型的数据进行一…

人工智能 2023年7月21日
0068
【python学习】如何将所绘制的图（单张/多张）保存到文件夹，并用绘制实时时间命名图片

python图片保存到文件夹基本存储（plt.savefig()）创建文件夹并存储图片（if结构+OS模块）批量绘制图片+批量存储（for循环）图片/文件夹命名与所运行时间…

人工智能 2023年7月6日
0069
ORB_SLAM2 源码解析 ORB特征提取（二）

目录一、各成员函数变量 1、定义一个枚举类型用于表示使用HARRIS响应值还是使用FAST响应值 2、内联函数都是用来直接获取类的成员变量的 3、保护成员二、计算特征点的方向 …

人工智能 2023年5月26日
0069
大数据是什么？1分钟了解大数据的概念

在21世纪我们迎来了大数据时代，大数据不仅对个人的日常生活产生了巨大的影响，对企业日常经营的影响更是深远。当前，企业的成长规模以及发展规划，都可以依靠大数据进行统计和分析，进而为企…

人工智能 2023年7月16日
0070
xhs-web校验流程分析

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月26日
0078
用卷积神经网络实现表情识别

用卷积神经网络实现表情识别一、卷积神经网络简介 * 1.定义 2.结构 3.理论 4.性质二、在python环境下实现三、总结一、卷积神经网络简介 1.定义卷积神经网络（…

人工智能 2023年7月14日
0067
深度学习之模型压缩（剪枝、量化）

作者：余晓龙随着深度学习的发展，模型变得越来越复杂，随之而来的模型参数也越来越多，对于需要训练的模型硬件要求也越来越高。模型压缩技术就是为了解决模型使用成本的问题。通过提高推理速…

人工智能 2023年6月17日
0072
Pytorch中更改预训练权重文件的下载位置

目录 1. 参考链接 2. 更改方法 3. 一个小技巧参考链接 Pytorch更改预训练权重下载位置 pytorch———修改预训练模型下载路径更改方法在线加载的预训练权重 …

人工智能 2023年7月23日
00206
Windows环境下tensorflow报错“Could not load library cudnn_cnn_infer64_8.dll. Error code 126”的解决方案

问题描述 Windows环境下tensorflow的报错信息为： Could not load library cudnn_cnn_infer64_8.dll. Error cod…

人工智能 2023年5月23日
0077
自动驾驶 2D 单目双目多目视觉方法一（Pseudo-LiDAR，Mono3D，FCOS3D，PSMNet）

文章目录概述 * 单目3D感知 – 3D目标检测单目深度估计双目3D感知 – 双目3D目标检测双目深度估计 Pseudo-LiDAR * 1. 核心…

人工智能 2023年6月1日
0098
【Pandas】多种添加行列数据方法

发现自己学习python 的各种库老是容易忘记，所有想利用这个平台，记录和分享一下学习时候的知识点，以后也能及时的复习，最近学习pandas，那我们来看看pandas添加数据的一些…

人工智能 2023年7月6日
00280
图神经网络-论文精读-“A Gentle Introduction to Graph Neural Networks“

目录文章链接：A Gentle Introduction to Graph Neural Networks 1、文章主要工作：解释了现代图神经网络 2、什么是图 3、什么样的数据…

人工智能 2023年7月13日
0069
目标检测系列算法:YOLOv7代码复现

交通视频检测复现：video/BV1Se4y1975L/ YOLOv7视频交通检测(看上去还是蛮快！）目录 0、模型结构简要说明 * 高效层聚合网络: concatenate模型…

人工智能 2023年7月9日
0088
结构光法的四步相移法求解相位差（matlab代码）

%读入第一组正弦照片 x1=imread(‘C:\Users\Administrator\Desktop\picture\1.png’);x2=imread…

人工智能 2023年6月22日
0059
python使用pygraphdb连接graphdb图数据库

文章目录前言一、GraphDB是什么？二、使用pygraphdb连接graphdb * 1.安装pygraphdb 2. 功能介绍 – 数据管理数据库管理 3….

人工智能 2023年6月1日
00102
【BERT类预训练模型整理】

BERT类预训练模型整理 1.BERT的相关内容 * 1.1 BERT的预训练技术 – 1.1.1 掩码机制 1.1.2 NSP（ Next Sentence Pred…

人工智能 2023年5月30日
0072

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

基于pytorch的图像识别基础完整教程

大家都在看