基于卷积神经网络的猫狗识别系统的设计与实现

2023年6月25日上午1:57 • 人工智能 • 阅读 93

1 ． 1 题目的主要研究内容

（1）工作的主要描述

通过卷积网络实现猫狗图像的识别。首先，在数据集中抽取训练集和测试集；其次，对图像进行预处理和特征提取，对图像数据进行图像增强，将图像从.jpg格式转化为RGB像素网格，再转化为像素张量；再次，搭建卷积神经网络模型；最后，使用模型进行训练，得到猫狗识别的准确率和二元交叉熵损失及其可视化图像，并对模型进行测试。

（2）系统流程图

1 ． 2 题目研究的工作基础或实验条件

（1）系统：Windows 10

处理器：i7-7700HQ CPU @2.80GHz

（2）编程软件：Pycharm

版本：Python 3.7

1 ． 3 数据集描述

数据集中共有25000张图片，其中猫狗图片各12500张，在数据集中抽取一部分作为训练集和测试集。训练集中猫狗图片各3000张，测试集猫狗图片各1000张。

1 ． 4 特征提取过程描述

为了防止模型过拟合，采用图像增强的方法，利用ImageDataGenerator方法调整参数对图像进行增强。将所有图片重设尺寸大小为150*150大小，并使用 ImageDataGenerator 方法将本地图片.jpg格式转化成RGB像素网格，再转化成浮点张量上传到网络上，将像素值（介于0和255之间）重新缩放到[0，1]间隔。ImageDataGenerator参数介绍如下：

参数名

含义

rotation_range

一个角度值（0-180），在这个范围内可以随机旋转图片

width_shift和height_shift

范围，在其中可以随机地垂直或水平地转换图片

shear_range

用于随机应用剪切转换

zomm_range

用于水平随机翻转一半的图像——当没有假设水平不对称时

horizontal_flip

用于在图片内部随机缩放

fill_mode

用于填充新创建像素的策略，它可以在旋转或宽度/高度移动之后出现

参数设置为：

1 ． 5 分类过程描述

卷积神经网络分为卷积层，池化层，激活函数，全连接层。首先将图片进行图像增强操作，然后将图片转化为150150格式输入，通过33卷积核提取特征，一个卷积核对应一种特征类型，相当于一个神经元，卷积核的每个元素都有一个权重系数和一个偏差量。在卷积层进行特征提取后，虽然图像会有所减小，但是为了特征值能够准确代表该区域图像特征，输出特征图仍然很大，为了保留主要特征，减少噪声传递，采用最大池化法，再次进行特征值提取。经4次卷积4次池化后，进行全连接，全连接起到分类器的作用，将特征映射到样本的标记空间。然后通过激活函数函数输出分类标签，最后算出识别的准确率和交叉熵损失。本系统共迭代100次，最后将训练集和测试集的准确率和交叉熵损失的可视化图像输出。

本系统卷积神经网络模型如图所示：

1 ． 6 主要程序代码 ( 要求必须有注释 )

import os, shutil
&#x539F;&#x59CB;&#x6570;&#x636E;&#x96C6;&#x89E3;&#x538B;&#x7F29;&#x6240;&#x5728;&#x76EE;&#x5F55;&#x7684;&#x8DEF;&#x5F84;
original_dataset_dir = 'E:/catdog/train/train'
&#x521B;&#x5EFA;&#x4E00;&#x4E2A;&#x5B58;&#x50A8;&#x8F83;&#x5C0F;&#x6570;&#x636E;&#x96C6;&#x7684;&#x76EE;&#x5F55;
base_dir = 'E:/catdog/find_cats_and_dogs'
&#x57F9;&#x8BAD;&#x3001;&#x9A8C;&#x8BC1;&#x548C;&#x6D4B;&#x8BD5;&#x62C6;&#x5206;
train_dir = os.path.join(base_dir, 'train')
validation_dir = os.path.join(base_dir, 'validation')
test_dir = os.path.join(base_dir, 'test')
&#x8BAD;&#x7EC3;&#x732B;&#x56FE;&#x7247;
train_cats_dir = os.path.join(train_dir, 'cats')
&#x8BAD;&#x7EC3;&#x72D7;&#x56FE;&#x7247;
train_dogs_dir = os.path.join(train_dir, 'dogs')
&#x9A8C;&#x8BC1;&#x732B;&#x56FE;&#x7247;
validation_cats_dir = os.path.join(validation_dir, 'cats')
&#x9A8C;&#x8BC1;&#x72D7;&#x56FE;&#x7247;
validation_dogs_dir = os.path.join(validation_dir, 'dogs')
&#x6D4B;&#x8BD5;&#x732B;&#x7684;&#x56FE;&#x7247;
test_cats_dir = os.path.join(test_dir, 'cats')
&#x6D4B;&#x8BD5;&#x732B;&#x7684;&#x56FE;&#x7247;
test_dogs_dir = os.path.join(test_dir, 'dogs')
&#x590D;&#x5236;&#x524D;3000&#x4E2A;cat&#x56FE;&#x50CF;&#x4EE5;&#x8BAD;&#x7EC3;&#x6A21;&#x578B;
fnames = ['cat.{}.jpg'.format(i) for i in range(3000)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(train_cats_dir, fname)
    shutil.copyfile(src, dst)
&#x5C06;1000&#x4E2A;&#x732B;&#x56FE;&#x50CF;&#x590D;&#x5236;&#x5230;&#x9A8C;&#x8BC1;
fnames = ['cat.{}.jpg'.format(i) for i in range(3000, 4000)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(validation_cats_dir, fname)
    shutil.copyfile(src, dst)
&#x590D;&#x5236;1000&#x4E2A;&#x732B;&#x56FE;&#x50CF;&#x5230;&#x6D4B;&#x8BD5;
fnames = ['cat.{}.jpg'.format(i) for i in range(3000, 4000)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(test_cats_dir, fname)
    shutil.copyfile(src, dst)
&#x590D;&#x5236;3000&#x4E2A;&#x72D7;&#x56FE;&#x7247;&#x53BB;&#x8BAD;&#x7EC3;&#x6A21;&#x578B;
fnames = ['dog.{}.jpg'.format(i) for i in range(3000)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(train_dogs_dir, fname)
    shutil.copyfile(src, dst)
&#x590D;&#x5236;1000&#x4E2A;&#x72D7;&#x56FE;&#x7247;&#x53BB;&#x9A8C;&#x8BC1;
fnames = ['dog.{}.jpg'.format(i) for i in range(3000, 4000)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(validation_dogs_dir, fname)
    shutil.copyfile(src, dst)
&#x590D;&#x5236;1000&#x4E2A;&#x72D7;&#x56FE;&#x7247;&#x53BB;&#x6D4B;&#x8BD5;
fnames = ['dog.{}.jpg'.format(i) for i in range(3000, 4000)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(test_dogs_dir, fname)
    shutil.copyfile(src, dst)
##&#x7EDF;&#x8BA1;&#x56FE;&#x7247;&#x6570;&#x91CF;
print('total training cat images:', len(os.listdir(train_cats_dir)))
print('total training dog images:', len(os.listdir(train_dogs_dir)))
print('total validation cat images:', len(os.listdir(validation_cats_dir)))
print('total validation dog images:', len(os.listdir(validation_dogs_dir)))
print('total test cat images:', len(os.listdir(test_cats_dir)))
print('total test dog images:', len(os.listdir(test_dogs_dir)))
from keras import layers
from keras import models
import scipy
from predata import *
import matplotlib.pyplot as plt
#&#x7F51;&#x7EDC;&#x6A21;&#x578B;
model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), activation='relu',
                        input_shape=(150, 150, 3)))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(128, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(128, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Flatten())
model.add(layers.Dense(512, activation='relu'))
model.add(layers.Dense(1, activation='sigmoid'))
###&#x8F93;&#x51FA;&#x6A21;&#x578B;&#x5404;&#x5C42;&#x7684;&#x53C2;&#x6570;&#x72B6;&#x51B5;
model.summary()
from keras import optimizers
#&#x914D;&#x7F6E;&#x4F18;&#x5316;&#x5668;&#xFF1A;
#loss&#xFF1A;&#x8BA1;&#x7B97;&#x635F;&#x5931;&#xFF0C;&#x8FD9;&#x91CC;&#x7528;&#x7684;&#x662F;&#x4EA4;&#x53C9;&#x71B5;&#x635F;&#x5931;
#metrics&#xFF1A;&#x5217;&#x8868;&#xFF0C;&#x5305;&#x542B;&#x8BC4;&#x4F30;&#x6A21;&#x578B;&#x5728;&#x8BAD;&#x7EC3;&#x548C;&#x6D4B;&#x8BD5;&#x65F6;&#x7684;&#x6027;&#x80FD;&#x7684;&#x6307;&#x6807;
model.compile(loss='binary_crossentropy',
              optimizer=optimizers.RMSprop(lr=1e-4),
              metrics=['acc'])
from keras.preprocessing.image import ImageDataGenerator
#&#x56FE;&#x50CF;&#x589E;&#x5F3A; &#x56FE;&#x7247;&#x683C;&#x5F0F;&#x8F6C;&#x5316;
train_datagen = ImageDataGenerator(
    rescale=1./255,
    rotation_range=40,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True,)
Note that the validation data should not be augmented!

test_datagen = ImageDataGenerator(rescale=1./255)
#&#x8BAD;&#x7EC3;&#x96C6;&#x56FE;&#x7247;&#x683C;&#x5F0F;&#x8F6C;&#x5316;
train_generator = train_datagen.flow_from_directory(
        # This is the target directory
        train_dir,
        # All images will be resized to 150x150
        target_size=(150, 150),
        batch_size=32,
        # Since we use binary_crossentropy loss, we need binary labels
        class_mode='binary')
#&#x6D4B;&#x8BD5;&#x96C6;&#x56FE;&#x7247;&#x683C;&#x5F0F;&#x8F6C;&#x5316;
validation_generator = test_datagen.flow_from_directory(
        validation_dir,
        target_size=(150, 150),
        batch_size=32,
        class_mode='binary')
#&#x6A21;&#x578B;&#x8BAD;&#x7EC3;
history = model.fit_generator(
      train_generator,
      steps_per_epoch=100,
      epochs=100,
      validation_data=validation_generator,
      validation_steps=50)
#&#x4FDD;&#x5B58;&#x6A21;&#x578B;
model.save('cats_and_dogs_small_1.h5')
#&#x53EF;&#x89C6;&#x5316;
acc = history.history['acc']
val_acc = history.history['val_acc']
loss = history.history['loss']
val_loss = history.history['val_loss']
epochs = range(len(acc))
plt.plot(epochs, acc, 'bo', label='Training acc')
plt.plot(epochs, val_acc, 'b', label='Validation acc')
plt.title('Training and validation accuracy')
plt.legend()
plt.figure()
plt.plot(epochs, loss, 'bo', label='Training loss')
plt.plot(epochs, val_loss, 'b', label='Validation loss')
plt.title('Training and validation loss')
plt.legend()
plt.show()
import cv2
import tensorflow as tf
categories = ['Dog', 'Cat']
from PIL import Image
import matplotlib.pyplot as plt
&#x56FE;&#x7247;&#x8DEF;&#x5F84;
#&#x8F6C;&#x5316;&#x56FE;&#x7247;&#x683C;&#x5F0F;
def prepare(path):
    img_size = 150
    img_array = cv2.imread(path)
    new_array = cv2.resize(img_array, (img_size, img_size))
    return new_array.reshape(-1, img_size, img_size, 3)
#&#x8C03;&#x7528;&#x6A21;&#x578B;
model = tf.keras.models.load_model('cats_and_dogs_small_1.h5')
#&#x6D4B;&#x8BD5;&#x4E00;&#x5F20;&#x56FE;&#x7247;
prediction = model.predict([prepare('3.jpg')])
if prediction == 1:
    title = "this is a dog"
else:
    title = "this is a cat"
img = Image.open("3.jpg")
#&#x53EF;&#x89C6;&#x5316;
plt.imshow(img)
plt.axis('off')  # &#x5173;&#x6389;&#x5750;&#x6807;&#x8F74;&#x4E3A; off
plt.title(title)  # &#x56FE;&#x50CF;&#x9898;&#x76EE;
plt.show()

1 ． 7 运行结果及分析

训练集和测试集的准确率变化：

训练集和测试集的损变化：

曲线没有过度拟合，训练曲线紧密地跟踪测试曲线，准确率虽然上下波动，但是最高能达到84%左右，测试集的准确率比训练集准确率高，交叉熵损失也呈下降趋势。

对模型进行测试：模型可以识别猫狗。

Original: https://blog.csdn.net/a1233219/article/details/125647790
Author: 小小蜗牛，大大梦想
Title: 基于卷积神经网络的猫狗识别系统的设计与实现

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/650109/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

安装opencv-python解决Building wheel for opencv-python (PEP 517)问题

开始是为了安装albumentations这个库，经常会卡在这步上，于是重新创建conda环境，重新安装opencv1conda环境中，如果不创建环境，激活环境，是会在全局安装你所…

人工智能 2023年7月18日
00125
展品讲解语音对话系统实验报告

展品讲解语音对话系统实验报告 1. 任务定义 2. 实验环境 3. 系统功能 4. 方法说明 * 4.1 本地录音 – 4.1.1 初始化 4.1.2 录音 4.1….

人工智能 2023年5月27日
00101
【NLP】文本处理的基本方法（超详解）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月31日
0087
Mask Rcnn代码与原理相结合解析

1：前言文章目录 * – 1：前言 – 2：图片的预处理 – 3：整体流程概述 – 4：搭建特征提取网络 – 4：an…

人工智能 2023年5月23日
0083
Small Object Detection using Context and Attention（论文阅读笔记）

Small Object Detection using Context and Attention 论文阅读笔记出处：2021 International Conference…

人工智能 2023年7月10日
0070
wenet/utils/mask.py代码理解

原理：后续补充链接代码位置： https://github.com/wenet-e2e/wenet/blob/main/wenet/utils/mask.py 函数定义：主要包括…

人工智能 2023年5月25日
0052
残差网络(Residual Network,ResNet)原理与结构概述

残差网络是为了解决模型层数增加时出现梯度消失或梯度爆炸的问题而出现的。传统的神经网络中，尤其是图像处理方面，往往使用非常多的卷积层、池化层等，每一层都是从前一层提取特征，所以随着层…

人工智能 2023年7月28日
0045
[论文笔记] BERT

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月28日
0067
全球及中国旋光仪行业发展格局分析及投资机会预测报告2022-2028年

全球及中国旋光仪行业发展格局分析及投资机会预测报告2022-2028年详情内容请咨询鸿晟信合研究网！【全新修订】：2022年3月【撰写单位】：鸿晟信合研究网1 旋光仪行业概述1….

人工智能 2023年6月11日
0076
RTX 3060+CUDA+CUDAnn+Pytorch安装（自己踩过的）

昨天买了一个铭瑄RTX3060的卡，准备回来做深度学习，结果各种踩坑，现在发一下我最后一次装成功的过程。 1、按装英伟达3060的驱动直接百度搜索NVIDIA驱动，就会出来官方G…

人工智能 2023年7月22日
0047
matplotlib.pyplot 柱形图添加条形颜色及宽度、设置标题文字颜色及大小

matplotlib.pyplot 柱形图添加条形颜色及宽度、设置标题文字颜色及大小 1. 第一个柱形图 2. 垂直柱形图添加中文标题 3. 水平柱形图添加中文标题 4. 设置条形…

人工智能 2023年6月15日
0079
论文笔记 Feature Selective Anchor-Free Module for Single-Shot Object Detection – CVPR 2019

2019 FSAF Feature Selective Anchor-Free Module for Single-Shot Object Detection Chenchen Z…

人工智能 2023年7月12日
0086
关于pytorch nn.KLDivLoss()损失计算loss值为负数的原因

原因1：预测值和标签值都需要进行softmax归一化处理原因2：预测值还需要再进行log计算，标签值不需要 KL散度 KL散度，又叫相对熵，用于衡量两个分布（离散分布和连续分布）…

人工智能 2023年6月15日
0089
android studio从已有项目添加并使用cpp代码

1、配置NDK和CMAKE要有ndk路径local.properities也要有2、创建文件夹和cpp文件可以是JNI创建cpp 3、java里要有native方法声明比如 pri…

人工智能 2023年7月20日
0054
【路径规划】A*算法方法改进思路简析

A*算法方法改进思路简析 0. 前言 1. A*算法的总体流程 2. A*算法的改进 * 2.1 启发函数的选择与优化 – 2.1.1 预估函数的选择 2.1.2 为启…

人工智能 2023年7月29日
0072
几种常用的噪声估计算法（二）

上篇”几种常用的噪声估计算法（一）“主要介绍了分位数噪声估计、直方图噪声估计和最小值跟踪噪声估计算法，本篇主要介绍基于递归平均噪声估计算法及其衍生算法。由于…

人工智能 2023年5月23日
0083

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

基于卷积神经网络的猫狗识别系统的设计与实现

（1）工作的主要描述

（2）系统流程图

大家都在看