鞋子，靴子，拖鞋傻傻分不清楚 pytorch实现分类入门小案例

2023年6月29日上午7:41 • 人工智能 • 阅读 87

鞋子，靴子，拖鞋傻傻分不清楚 pytorch入门

前言
方法
*
网络
优化器
损失函数
总体方法
代码实现
*
图片加字
神经网络
总结

前言

从入学到现在已经两个多月了，看了一个多月的论文不知道学到了啥

正好最近看了看pytorch的入门，像休息休息，就想着写个分类玩玩吧，但不知道写啥，突然见看到一个数据集网站，有一个鞋子的数据集

这对我这种非常like鞋的人来说很有吸引力，那来整个鞋子分类吧。

; 方法

网络

这里我们选用的网络是DenseNet，相比于普通的CNN来说，Densenet可以使用各层提取的特征，从而避免特征的丢失，同样，我们再进行分类也希望尽可能多的特征为我们所用，Densenet的网络结构如下

; 优化器

使用的是随机梯度下降优化器，其中学习率设置为0.001，动量为0.5
具体的内容可以参考该博客详解随机梯度下降法（Stochastic Gradient Descent，SGD）

损失函数

使用的是交叉熵损失函数

这里多说几句，最开始我看到这个损失的时候一脸懵逼，咋着，一个数还能和一个向量比较一下子

直到后面我看到b站的讲解，好吧， 可能！

这就是b站里给到的公式

这里的x是指图像真实的类别，class是指图像在该类别的得分，x[j]是指所有类别在预测后的得分

以我们要介绍的网络为例，因为要判断的只有三类，鞋子，靴子和凉鞋，则我们最终的输出维度是3，即最终会输出一个向量，这个向量有三个值，分别代表分为鞋子，靴子和凉鞋的概率得分，越大就表示图片属于这一类的可能性越大。

例如我们输出的结果为[0.1 , 0.2, 0.8]

假如我们要输入的图片类别是第2类（从0开始算），那么带入上面公式就是

-2*0.8+log(e(0.1)+e(0.2)+e(0.3))

则当上面公式越小时，越接近真实结果

; 总体方法

这样就很简单了，就是利用我们现有的1.5万照片去训练该网络（这里做的比较糙，没有设置验证集和测试集），采用随机梯度下降的方式进行训练，每次训练的图片数量为10，所有图片被作为输入训练一次后为一个epoch，总共训练50个epoch，训练结束后就是我们需要的模型了。

代码实现

图片加字

在判断类别后在图片上加上类别，方便看

from PIL import ImageFont, ImageDraw, Image
import numpy as np
import cv2

def settags(info, img):
    url = img
    img_cv = cv2.imread(img)
    img = Image.fromarray(img_cv)
    font1 = ImageFont.truetype("./simsun.ttc", 100)
    draw = ImageDraw.Draw(img)
    draw.text((10, 10), info, font=font1, fill=(0, 0, 255))
    img1 = np.array(img)
    cv2.imwrite('r' + url, img1)

神经网络

卷积层


class ConvLayer(torch.nn.Module):
    def __init__(self, in_channels, out_channels, kernel_size, stride, is_last=False):
        super(ConvLayer, self).__init__()
        reflection_padding = int(np.floor(kernel_size / 2))
        self.reflection_pad = nn.ReflectionPad2d(reflection_padding)
        self.conv2d = nn.Conv2d(in_channels, out_channels, kernel_size, stride)
        self.dropout = nn.Dropout2d(p=0.5)
        self.is_last = is_last

    def forward(self, x):

        out = self.reflection_pad(x)
        out = self.conv2d(out)
        if self.is_last is False:
            out = F.leaky_relu(out, inplace=True)
        return out

单个densenet


class DenseConv2d(torch.nn.Module):
    def __init__(self, in_channels, out_channels, kernel_size, stride, is_Last=False):
        super(DenseConv2d, self).__init__()
        self.dense_conv = ConvLayer(in_channels, out_channels, kernel_size, stride, is_Last)
        self.is_last = is_Last

    def forward(self, x):
        out = self.dense_conv(x)
        if self.is_last == False:

            out = torch.cat([x, out], 1)
        return out

所有DenseNet

out_channels_def = 16
        denseblock = []

        denseblock += [DenseConv2d(in_channels, out_channels_def, kernel_size, stride),
                       DenseConv2d(in_channels + out_channels_def, out_channels_def, kernel_size, stride),
                       DenseConv2d(in_channels + out_channels_def * 2, out_channels_def, kernel_size, stride),
                       DenseConv2d(in_channels + out_channels_def * 3, out_channels_def, kernel_size, stride),
                       DenseConv2d(in_channels + out_channels_def * 4, out_channels_def, kernel_size, stride),
                       DenseConv2d(in_channels + out_channels_def * 5, out_channels_def, kernel_size, stride),
                       DenseConv2d(in_channels + out_channels_def * 6, out_channels_def, kernel_size, stride, True)
                       ]
        self.denseblock = nn.Sequential(*denseblock)

训练

def train():
    net = Net(3, 3, 1)
    net.cuda()
    net.train()

    cirterion = nn.CrossEntropyLoss()
    optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.5)
    for epoch in range(50):
        running_loss = 0.0
        for i, data in enumerate(train_loader, 0):
            inputs, labels = data
            inputs, labels = Variable(inputs), Variable(labels)
            inputs = torch.tensor(inputs)
            labels = torch.tensor(labels)
            inputs = inputs.cuda()
            labels = labels.cuda()
            optimizer.zero_grad()
            outputs = net(inputs)
            loss = cirterion(outputs, labels)
            loss.backward()
            optimizer.step()
            running_loss += loss.item()
            if i % 5 == 0:
                print('[%d %5d] loss: %.3f' % (epoch + 1, i + 1, running_loss / 200))
                running_loss = 0.0

        torch.save(net, 'shoenet' + epoch.__str__() + '.pth')
    torch.save(net, 'shoenet.pth')

总结

第一次写神经网络的代码，花了好久才搞出来，虽然很多代码都是照葫芦画瓢，但对我这种小白来说确实蛮难的，但总归是搞出来了，来看下结果把。

可以看到哈，分类还是ok 的，那就到这了，溜了溜了

Original: https://blog.csdn.net/qq_43627076/article/details/127822180
Author: 小王不头秃
Title: 鞋子，靴子，拖鞋傻傻分不清楚 pytorch实现分类入门小案例

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/658721/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

pytorch复现U-Net 及常见问题汇总（2021.11.14亲测可行）

目录 2021.11.14复现过程：训练过程常见问题整理：之前简单地写了一个pytorch的U-net 复现过程，有很多小伙伴在评论里有很多疑问，抽空又复现了一遍，简单整理了常…

人工智能 2023年6月23日
0085
十分钟掌握聚类算法的评估指标

聚类算法属于非监督学习，它并不像分类算法那样可以使用训练集或测试集中的数据来计算准确率、召回率等。那么如何评估聚类算法得好坏呢？好的聚类算法，一般要求类簇具有：簇内 (int…

人工智能 2023年5月31日
0057
neo4j构建郑州2022-年前疫情知识图谱

neo4j构建知识图谱（python编程疫情知识图谱）一、知识图谱简介历史由来什么虚头八脑的咱就直接跳过了，说一说我自己对知识图谱的理解吧。知识图谱理解起来很简单，知识+图谱…

人工智能 2023年6月1日
0097
Softmax回归及损失函数（李沐深度学习课程、自用）

1 Softmax回归回归预测连续值，分类预测离散值分类多个输出，第i个输出代表第i类的置信度。 1.1 置信度转换在分类中，希望能尽可能地使正确类别的置信度远大于其它类别。…

人工智能 2023年6月18日
00135
2022李宏毅作业hw1—新冠阳性人员数量预测。

目录事前：一：数据读取。完整代码：二模型设计。完整代码：三训练步骤。完整的训练代码：这一部分被我放在model_utils的train模块里。四：测试和保存…

人工智能 2023年6月15日
00110
【语音识别】基于matlab GUI声纹识别（带面板）【含Matlab源码 537期】

⛄一、案例简介本文基于Matlab设计实现了一个文本相关的声纹识别系统，可以判定说话人身份。1 系统原理a 声纹识别这两年随着人工智能的发展，不少手机App都推出了声纹锁的功能。…

人工智能 2023年5月27日
0099
nebula graph 在 Spark 数据导入中的一些实践细节，以及PR心路历程

0.写在前面 2020真是魔幻的一年，刚过完大年，由于janusgraph的性能过于使人沮丧，正准备放弃分布式图谱调研的我，突然邂逅了nebula graph（以下简称NG）。不得…

人工智能 2023年6月10日
0076
RK3588+AI+FPGA图像处理硬件算法加速解决方案

RK3588是瑞芯微新一代旗舰级高端处理器，具有高算力、低功耗、超强多媒体、丰富数据接口等特点。搭载四核A76+四核A55的八核CPU和ARM G610MP4 GPU，内置6.0T…

人工智能 2023年6月18日
0075
使用Python处理百万数据量的Excel文件：删除列、切分换行、替换去重

使用Excel或WPS打开几十万、几百万行数据的文件十分缓慢，进行数据处理很容易卡死崩溃。这几天在处理一份数据文件的时候我尝试边学边用Python，获得了预想的效果。记录一下处理…

人工智能 2023年7月15日
00151
神经网络的图像识别技术,神经网络识别图像原理

图像识别系统有几种方式？具体是什么？图片识别的实现基础是由图像处理、计算机视觉和模糊识别等多学科实现的，现阶段市面上已经有很多像图普科技成熟大厂可以提供智能审核的软件。在人工智…

人工智能 2023年7月13日
00101
煮酒论开源语音工具包

语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_p…

人工智能 2023年5月27日
0070
自动驾驶碰撞检查

详细驾驶图解学驾驶技术资料基本动作练习目标：建立上下车的安全意识，掌握正确的驾驶姿势。安全确认内容：确认汽车前后没有人和障碍物。上车、下车方法 1.安全确认确认车的前后…

人工智能 2023年6月10日
0077
“天池”淘宝用户消费行为分析——sql

文章目录 * – 0 项目背景 – + 1 项目明细 + * – 1.1 数据的来源及明细 – 1.2 项目目的 – 1…

人工智能 2023年7月16日
00152
自监督模型—MoCoV3

摘要本文没有描述一种新的方法。相反，考虑到计算机视觉的进展，它研究了一个直接的、增量的、但必须知道的基线：视觉变压器(ViT)的自我监督学习。虽然标准卷积网络的训练配方已经高度…

人工智能 2023年5月28日
00114
OpenCV笔记：cv2.VideoCapture 完成视频的跳帧输出操作

背景我开始关注这个问题，是在使用 PaddleOCR + OpenCV 进行视频文字识别的时候，因为OpenCV 需要循环读取视频的每一帧进行解析，这就导致视频播放特别卡顿。由于…

人工智能 2023年7月18日
0074
健康管理师【16】

1.健康促进的核心策略为 A.实行干预措施B.社会动员C.对群众来说强调自愿D.非政府组织的参与E.专业人员的参与 2.下列属于肥胖症高危人群管理措施的是 3.以下步骤不属于健康风…

人工智能 2023年7月17日
0052

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

鞋子，靴子，拖鞋傻傻分不清楚 pytorch实现分类 入门小案例