卷积神经网络实践-猫狗分类

2023年6月30日下午2:18 • 人工智能 • 阅读 71

写在前面
本文主要参考的是飞桨上的一个模型https://aistudio.baidu.com/aistudio/projectdetail/78960?channelType=0&channel=0
这个模型里面，就是简单的三次卷积层加上全连接层，最后softmax分一下类，最后效果一般，后来在一篇博客上看到看到vgg网络对简单分类效果会比较好，就尝试更换vgg-13，没想到正确率提升了20%，当然不足也有很多，就比如为了偷懒没有多尝试几个模型实验，看情况以后会补上

1. 摘要
近年来，深度学习理论和技术都得到了迅速的发展，并且受到了越来越多的研究者的关注，深度学习技术在图像识别领域具有广泛的应用。尤其是在特征提取和建模上有着非常明显的优势浅层对比模型。现在已经有了非常多的经典成熟模型，如AlexNet、VGG13、VGG16、VGG19和ResNet等，但未必适用于所有的试验数据集。本文运用卷积神经网络（CNN）依靠PaddlePaddle深度学习框架结合CIFAR10数据集训练和建立猫狗识别模型，在较成熟的VGG13模型基础实现，采用的优化方法为Adam优化方法。

2. 卷积神经网络

传统CNN包含卷积层、全连接层等组件，并采用softmax多类别分类器和多类交叉熵损失函数，一个典型的卷积神经网络如图6所示，我们先介绍用来构造CNN的常见组件。

卷积层(convolution layer): 执行卷积操作提取底层到高层的特征，发掘出图片局部关联性质和空间不变性质。

池化层(pooling layer): 执行降采样操作。通过取卷积输出特征图中局部区块的最大值(max-pooling)或者均值(avg-pooling)。降采样也是图像处理中常见的一种操作，可以过滤掉一些不重要的高频信息。

全连接层(fully-connected layer，或者fc layer): 输入层到隐藏层的神经元是全部连接的。

非线性变化: 卷积层、全连接层后面一般都会接非线性变化函数，例如Sigmoid、Tanh、ReLu等来增强网络的表达能力，在CNN里最常使用的为ReLu激活函数。

Dropout:在模型训练阶段随机让一些隐层节点权重不工作，提高网络的泛化能力，一定程度上防止过拟合。

另外，在训练过程中由于每层参数不断更新，会导致下一次输入分布发生变化，这样导致训练过程需要精心设计超参数。如2015年Sergey Ioffe和Christian Szegedy提出了Batch Normalization (BN)算法中，每个batch对网络中的每一层特征都做归一化，使得每层分布相对稳定。BN算法不仅起到一定的正则作用，而且弱化了一些超参数的设计。经过实验证明，BN算法加速了模型收敛过程，在后来较深的模型中被广泛使用。

3. 实验及结果分析

3.1 实验环境与数据集
本实验是在基于Anaconda的环境管理工具、paddle深度学习框架和Pycharm的编译器上进行设计实现的。研究环境如下所示：
（1）软件部分
操作系统：Windows10 64位系统；开发工具：Pycharm、Anaconda；CUDA：V11.7_win10；paddle-gpu：2.3.2 ；
（2）硬件部分
内存：16G；CPU：AMD Ryzen 7 5800H 3.20 GHz；GPU：NVIDIA GeForce GTX 1650；硬盘：固态硬盘:512G。

（3）数据集部分

我们使用CIFAR10数据集。CIFAR10数据集包含60,000张32×32的彩色图片，10个类别，每个类包含6,000张。其中50,000张图片作为训练集，10000张作为验证集。这次我们只对其中的猫和狗两类进行预测。

3.2 损失函数

本文采用的是交叉熵损失函数，该函数在分类任务上比较常用。

3.3 网络模型

CNN 有着多种可供选择的网络结构，其中包括有LeNet、AlexNet、VGGNet 、ResNet 等。其中VGGNet 是由牛津大学的视觉几何组和谷歌的DeepMind 公司提出，通过VGGNet，研究人员证明了基于小尺寸卷积核，增加网络深度可以有效提升模型效果。VGGNet 引入”模块化”设计思想，将不同的层进行简单组合构成网络模块，再用模块来组装完整网络，而不再以”层”为单元组装网络。VGGNet 有着多种配置方案，本文采用VGG-13，也就是B型VGG结构。

3.4 实验结果

随着迭代次数增加损失逐渐减少，精确率逐渐提高

实验精确率acc 最终稳定在0.83 左右，较为优越

对于6张图片的识别，5张识别正确

4. 总结

本文运用卷积神经网络在CIFAR10数据集的基础上，运用VGG13模型训练和建立猫狗识别模型，获得了较为优越的实验结果。

Original: https://blog.csdn.net/EnochChen_/article/details/127520275
Author: EnochChen_
Title: 卷积神经网络实践-猫狗分类

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/661449/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Java面试之Java基础篇(offer 拿来吧你)

现在关于Java面试的资料是层出不穷，对于选择困难症的同学来说，无疑是陷入了一次次的抉择与不安中，担心错过了关键内容，现在小曾哥秉持着”融百家之所长,汇精辟之文档&#8…

人工智能 2023年6月21日
0070
计算机视觉（三）图像拼接

文章目录 * – 一、流程与概念 – + 1.1 流程 + 1.2 映射与处理 – 二、算法 – + 2.1 全景拼接 + 2.2 …

人工智能 2023年5月26日
0065
pyspark 的重大进步：pyspark 3.2 版本核心细节解读

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月8日
0044
anaconda安装tensorflow2，报错cannot import name ‘secure_write‘

Anaconda安装tensorflow2 我们在使用anaconda创建虚拟环境，安装tensorflow2及各种相关的依赖时，可能由于各种依赖的安装顺序不同，而导致出现各种奇怪…

人工智能 2023年5月25日
0059
WenLan 2.0：一种不依赖Object Detection的大规模图文匹配预训练模型 & 数据+算力=大力出奇迹

WenLan 2.0：一种不依赖Object Detection的大规模图文匹配预训练模型 & 数据+算力=大力出奇迹 FesianXu 20211202 at Baidu…

人工智能 2023年7月12日
00116
用自己的数据集跑LINS—LiDAR-inertial-SLAM

用自己的数据集跑LINS—LiDAR-inertial-SLAM 前言一、下载运行代码二、运行自己的bag包 * 1.话题 2.–clock 用自己的数…

人工智能 2023年6月11日
0080
【Python】推荐五个常用的图像处理库

引言 Python目前是世界上使用最多的编程语言之一。它能够以更少的工作量和更少的代码行数来完成许多事情。它还可以使用很少的代码行来方便地编辑和创建图像。本文重点介绍，在图像处理领…

人工智能 2023年5月26日
0063
基于多特征的遥感影像阴影提取（python+matlab代码）

来源：那些年”南方测绘杯”科技论文比赛做的工作先看效果：实现思路：由于遮挡物的存在，会使辐射源（太阳）辐射能量不能到达地面某些区域，这些区域就是遥感…

人工智能 2023年6月20日
0063
TensorFlow简单使用（基础篇）

目录一、TensorFlow的数据类型二、如何创建一个张量三、常用函数 1.强制转换、最大值、最小值 2.平均值、求和 3.标记为可训练 4.四则运算 5.平方、次方与开方 …

人工智能 2023年5月23日
0068
睿帆科技入选艾瑞咨询“数据中台产业链生态图谱”

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月28日
0090
【JAVA进阶篇】时间与日期相关类

1. Java_工具概述很多人初学程序时，总是在想，那么多的算法该怎么写呀？那么多的数据结构都不熟悉，该怎么实现呀？总是担心英语不好程序学不精通，数学不好写程序无法达到巅峰。学的…

人工智能 2023年5月30日
0067
【OpenCV 例程200篇】67. 空间域图像增强的综合应用

【OpenCV 例程200篇】67. 空间域图像增强的综合应用欢迎关注『OpenCV 例程200篇』系列，持续更新中欢迎关注『Python小白的OpenCV学习课』系列，持续…

人工智能 2023年6月20日
0088
路径规划与优化学习系列（一）—路径规划算法

路径规划与优化学习系列（一）—路径规划算法前言几个月来浑浑噩噩，人生这张地图实在太大了，顿时觉得人生之路障碍重重、迷茫不清，故此受人启发，一学路径规划之法，以解心头之困，以便找…

人工智能 2023年6月24日
0057
数据结构之栈的实现

文章目录前言 1.栈的相关介绍 * 1.栈的概念 2.栈结构实现方式 2.具体代码实现栈 * 1.栈的相关接口 2.栈结构的定义声明和栈的初始化 3.栈数据的处理 –…

人工智能 2023年6月29日
0067
（五）YOLO-V3核心源码讲解（1）

当当当当！看了不少理论知识啦，相信大家都有些倦了，现在我们正式来学习YOLO系列的源码~~😎（环境配置：pytorch+python3.7.6 其他依赖包按需安装即可）第一部分我…

人工智能 2023年7月12日
0047
同态加密详解

什么是同态加密同态加密（Homomorphic Encryption）是指将原始数据经过同态加密后，对得到的密文进行特定的运算，然后将计算结果再进行同态解密后得到的明文等价于原始…

人工智能 2023年7月30日
0032

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

卷积神经网络实践-猫狗分类

大家都在看