猫狗识别与分类

2023年7月1日上午9:04 • 人工智能 • 阅读 97

猫狗识别与分类

文章目录

猫狗识别与分类
*
一、前言
二、环境配置
三、源码以及数据集
四、基础猫狗识别程序如下
–
五、配置环境过程
–
六、运行基础程序
–
七、基于DenseNet神经网络构架的猫狗识别训练程序
–

一、前言

在实现猫狗识别的时候，我看到csdn上检索的猫狗识别有一些博客比较繁杂，可是作为正式进入AL世界的Hello world，这是不合理的，代码本来就不复杂。
繁杂的操作和图片有点让人生畏，所以我决定有必要重写一下程序、记录一下过程。

下面是一些国内的pip源，有需要可自取

阿里云 http://mirrors.aliyun.com/pypi/simple/
中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/
豆瓣(douban) http://pypi.douban.com/simple/
清华大学 https://pypi.tuna.tsinghua.edu.cn/simple/
中国科学技术大学 http://pypi.mirrors.ustc.edu.cn/simple/

二、环境配置

软件：ANACONDA3+Pycharm2019

keras>=2.7；
tensorflow>=2.7
注：一定关掉科学上网

三、源码以及数据集

链接：https://pan.baidu.com/s/1gvFfpK64Z16rkW81jWVZdw
提取码：f1ff

四、基础猫狗识别程序如下

1、train.py

基于卷积池化构架的猫狗识别训练程序

train.py程序结构：

第一步：导入包
第二步：指定一些超参数
第三步：准备训练集和验证集
第四步：建立神经网络模型
第五步：训练模型
*第六步：根据训练过程中的信息绘制图表


import numpy as np
import os,random,shutil
np.random.seed(7)

FOLDER=".\\dataset_default"
train_data_dir=os.path.join(FOLDER,'train')
val_data_dir=os.path.join(FOLDER,'validate')

train_samples_num=4916
val_samples_num=1439
IMG_W,IMG_H,IMG_CH=150,150,3
batch_size=32
epochs=20
class_num=2

from keras.preprocessing.image import ImageDataGenerator
train_datagen = ImageDataGenerator(
        rescale=1. / 255,
    rotation_range=40,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True,
    fill_mode='nearest'
        )

train_generator = train_datagen.flow_from_directory(
    train_data_dir,
    target_size=(IMG_W, IMG_H),
    batch_size=batch_size,
    color_mode='rgb',
    class_mode='categorical')

val_datagen = ImageDataGenerator(rescale=1. / 255)

val_generator = val_datagen.flow_from_directory(
        val_data_dir,
        target_size=(IMG_W, IMG_H),
        batch_size=batch_size,
        color_mode='rgb',
        class_mode='categorical')

from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D
from keras.layers import Activation, Dropout, Flatten, Dense

def build_model(input_shape):

    model = Sequential()
    model.add(Conv2D(32, (3, 3), input_shape=input_shape))
    model.add(Activation("relu"))
    model.add(MaxPooling2D(pool_size=(2, 2)))

    model.add(Conv2D(32, (3, 3)))
    model.add(Activation("relu"))
    model.add(MaxPooling2D(pool_size=(2, 2)))

    model.add(Flatten())
    model.add(Dense(64))
    model.add(Activation("relu"))
    model.add(Dropout(0.5))
    model.add(Dense(class_num))
    model.add(Activation("softmax"))

    from tensorflow import optimizers
    model.compile(
        loss="categorical_crossentropy",
        optimizer='adam',
        metrics=["accuracy"],
    )

    return model

model=build_model(input_shape=(IMG_W,IMG_H,IMG_CH))

history_ft = model.fit(train_generator,
                       steps_per_epoch=train_samples_num // batch_size,
                       epochs=epochs,
                       validation_data=val_generator,
                       validation_steps=val_samples_num // batch_size
                       )

model.save("./model.h5")
print(history_ft.history.keys())

import matplotlib.pyplot as plt
acc = history_ft.history['accuracy']
val_acc = history_ft.history['val_accuracy']
loss = history_ft.history['loss']
val_loss = history_ft.history['val_loss']

epochs = range(len(acc))

plt.plot(epochs, acc, 'bo', label='Training acc')
plt.plot(epochs, val_acc, 'b', label='validate acc')
plt.title('Training and validation acc')
plt.legend()

plt.show()

plt.plot(epochs, loss, 'bo', label='Training loss')
plt.plot(epochs, val_loss, 'b', label='validate Loss')
plt.title('Training and validation loss')
plt.legend()

plt.show()

2、detect.py

detect.py程序结构：

第一步：导入库以及定义一些参数
第二步：定义一个函数，从测试文件夹内读取任意一张图片
第三步：定义一个预测函数
*第四步：载入模型并预测


import os, random
from matplotlib.pyplot import imshow
import numpy as np
import matplotlib.pyplot as plt
IMG_W,IMG_H,IMG_CH=150,150,3

def read_random_image():
    folder=r"./Imgs/"
    file_path = folder + random.choice(os.listdir(folder))
    pil_im = Image.open(file_path, 'r')
    return pil_im

from PIL import Image
from keras.preprocessing import image

def predict(model, img, target_size):
    name = ["猫", "狗"]
    if img.size != target_size:
        img = img.resize(target_size)

    x = image.img_to_array(img)
    x *= 1. / 255
    x = np.expand_dims(x, axis=0)
    preds = model.predict(x)

    imshow(np.asarray(img))

    print(preds)
    for i in range(2):
        if preds[0][i]>0.5:
            print(name[i])
            break

from keras.models import load_model
model_path = './model.h5'
model = load_model(model_path)

print("下面将抽五张图并预测如下：")
for i in range(5):
    print("该图片的猫狗概率如下:")
    predict(model,read_random_image(),(IMG_W,IMG_H))
    plt.show()

'''
test_datagen = ImageDataGenerator(rescale=1. / 255) # 只需要和trainset同样的scale即可，不需增强

test_data_dir="./data_oppo/train"
val_generator = test_datagen.flow_from_directory(
        test_data_dir,
        target_size=(IMG_W, IMG_H),
        batch_size=32,
        color_mode='rgb',
        class_mode='categorical')
test_loss,test_acc=model.evaluate(val_generator)
print("test_acc={}  test_loss={}".format(test_acc,test_loss))
'''

以下是跑通这个程序的过程。如果清楚这些步骤的过程可以略过下面

五、配置环境过程

1、打开Anaconda Prompt

a、创建一个叫MNIST4的环境

conda create -n MNIST4 python=3.8

注：记得python=3.8，大了就下载不了tensorflow包了
注：名字不重要，你之后想起什么名字都可以

b、创建成功后激活环境并下载keras包：

conda activate MNIST4

为了提高下载速度，在国内清华源中下载keras包

pip install keras -i https://pypi.tuna.tsinghua.edu.cn/simple/

c、下载matplotlib包

pip install matplotlib -i https://pypi.tuna.tsinghua.edu.cn/simple/

d、下载tensorflow包

pip install tensorflow -i https://pypi.tuna.tsinghua.edu.cn/simple/

e、下载SciPy包

pip install SciPy -i https://pypi.tuna.tsinghua.edu.cn/simple/

2、打开Pycharm配置

配置代码运行环境

注：这里刷新出来的时候比较长，需要等等
之后一路点击确认下去

; 六、运行基础程序

这个程序是最基础的程序，有训练模型，部署模型的能力，数据集6000简单训练20轮，验证集精度大概有0.7的精度，
当然这只是用来玩的基础版本，一定要理解， 之后的VGG–>Res–>DenseNet–>EffectionNet
也都只是时间问题了。

1、运行train程序

a、将开头的程序copy进pycharm的程序中

; b、运行结果：

这样就训练成功了。

训练数据画图如下：

1、运行detect程序

a、将开头的detect程序进pycharm的程序中

; b、运行结果

七、基于DenseNet神经网络构架的猫狗识别训练程序

DenseNet神经网络架构是2017年比较活的架构
到2020年虽然干不过谷歌的EffectionNet不过在很多方面已经很优秀了
所以特意举这个例子

数据集：6000
验证集精度大概在0.97左右。

1、在之前的基础上导入sklearn包

pip install sklearn -i https://pypi.tuna.tsinghua.edu.cn/simple/

2、将程序copy到pycharm

train.py程序结构

第一步：导入相应的库和指定超参数
第二步：学习率修改函数
第三步：准备训练集
第四步：建立Keras模型：模型的建立主要包括模型的搭建，模型的编译
第五步：回调函数
第六步：模型的训练
第七步：绘制训练过程图像

from idlelib import history

from tensorflow.keras.callbacks import ReduceLROnPlateau,ModelCheckpoint
import tensorflow as tf
import os

FOLDER=".\\dataset_default"
train_data_dir=os.path.join(FOLDER,'train')
val_data_dir=os.path.join(FOLDER,'validate')
train_samples_num=4916
val_samples_num=1439

IMG_W,IMG_H,IMG_CH=150,150,3
batch_size=32
epochs=10
class_num=2

if not os.path.exists("save_weights"):
    os.makedirs("save_weights")

def lr_schedule(epoch):
    """Learning Rate Schedule
        Learning rate is scheduled to be reduced after 80, 120, 160, 180 epochs.

        Called automatically every epoch as part of callbacks during training.

        # Arguments
        epoch (int): The number of epochs
        # Returns
        lr (float32): learning rate
"""
    lr = 1e-4
    if epoch > 40:
        lr *= 0.5e-3
    elif epoch > 30:
        lr *= 0.5
    elif epoch > 20:
        lr *= 0.5
    elif epoch > 10:
        lr *= 0.5
    print('Learning rate: ', lr)
    return lr

from keras.preprocessing.image import ImageDataGenerator
'''
在深度学习中，一般要求样本的数量要充足，样本数量越多，训练出来的模型效果越好，模型的泛化能力越强。但是实际中，样本数量不足或者样本质量不够好，这就要对样本做数据增强，来提高样本质量。
关于数据增强的作用总结如下：
1，增加训练的数据量，提高模型的泛化能力
2，增加噪声数据，提升模型的鲁棒性
讲解数据增强的文章：#https://zhuanlan.zhihu.com/p/41679153
'''
train_datagen = ImageDataGenerator(rescale=1.0 / 255,
                                   rotation_range=40,
                                   width_shift_range=0.2,
                                   height_shift_range=0.2,
                                   shear_range=0.2,
                                   zoom_range=0.2,
                                   horizontal_flip=True,
                                   fill_mode='nearest')
'''
  ImageDataGenerator类的简单介绍
（1）图片生成器，负责生成一个批次一个批次的图片，以生成器的形式给模型训练；

（2）对每一个批次的训练图片，适时地进行数据增强处理（data augmentation）；
'''

train_generator = train_datagen.flow_from_directory(
                                    train_data_dir,
                                    target_size=(IMG_W, IMG_H),
                                    batch_size=batch_size,
                                    shuffle=True,
                                    color_mode='rgb',
                                    class_mode='categorical')

val_datagen = ImageDataGenerator(rescale=1.0 / 255)

val_generator = val_datagen.flow_from_directory(
        val_data_dir,
        target_size=(IMG_W, IMG_H),
        batch_size=batch_size,
        shuffle=False,
        color_mode='rgb',
        class_mode='categorical')

from keras.models import Sequential
from keras.initializers import TruncatedNormal

def build_model(input_shape):

    covn_base = tf.keras.applications.DenseNet121(weights='imagenet', include_top=False, input_shape=(150, 150, 3))
    covn_base.trainable = True

    for layers in covn_base.layers[:-5]:
        layers.trainable = False

    model = tf.keras.Sequential()
    model.add(covn_base)
    model.add(tf.keras.layers.GlobalAveragePooling2D())
    model.add(tf.keras.layers.Dense(512, activation='relu'))
    model.add(tf.keras.layers.Dropout(rate=0.5))
    model.add(tf.keras.layers.Dense(2, activation='softmax'))
    model.summary()

    model.compile(optimizer=tf.optimizers.RMSprop(lr_schedule(0)),
                  loss='binary_crossentropy',
                  metrics=["accuracy"])
    return model

model=build_model(input_shape=(IMG_W,IMG_H,IMG_CH))

reduce_lr = ReduceLROnPlateau(
                                monitor='val_loss',
                                factor=0.1,
                                patience=2,
                                mode='auto',
                                verbose=1
                             )

checkpoint = ModelCheckpoint(
                                filepath='./save_weights/myDenseNet121.h5',
                                monitor='val_accuracy',
                                save_weights_only=False,
                                save_best_only=True,
                                mode='auto',
                                period=1
                            )

history_ft = model.fit(train_generator,
                       steps_per_epoch=train_samples_num // batch_size,
                       epochs=epochs,
                       validation_data=val_generator,
                       validation_steps=val_samples_num // batch_size,
                        callbacks=[checkpoint, reduce_lr]
                       )

model.save("./model2.h5")
print(history_ft.history.keys())

import matplotlib.pyplot as plt
acc = history_ft.history['accuracy']
val_acc = history_ft.history['val_accuracy']
loss = history_ft.history['loss']
val_loss = history_ft.history['val_loss']

epochs = range(len(acc))

plt.plot(epochs, acc, 'bo', label='Training acc')
plt.plot(epochs, val_acc, 'b', label='validate acc')
plt.title('Training and validation acc')
plt.legend()

plt.show()

plt.plot(epochs, loss, 'bo', label='Training loss')
plt.plot(epochs, val_loss, 'b', label='validate Loss')
plt.title('Training and validation loss')
plt.legend()

plt.show()

3、运行结果

可以看到算比较理想，验证集精度0.97。毕竟数据集那么小，才6000张图片。
kaggle正式比赛时候训练的模型数据集可是25000张图片
至于为什么验证集精度比训练集精度高可以看这篇博客：https://blog.csdn.net/qq_51116518/article/details/122227731

Original: https://blog.csdn.net/qq_51116518/article/details/122225124
Author: 风吹落叶花飘荡
Title: 猫狗识别与分类

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/663072/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

delta method 介绍

一、什么是delta方法众所周知，当一个变量X X X服从正态分布时，其线性变换也服从正态分布。那么非线性变换呢？ delta方法提出，其经过可导函数变换后得到的g ( X ) …

人工智能 2023年6月25日
00105
机器学习：基本流程

原文链接：https://blog.csdn.net/qq_27567859/article/details/79666969 简介：机器学习是一门多学科交叉专业，涵盖概率论知识，…

人工智能 2023年6月15日
0087
基于python中cv2库的图像分割

一.概念 1.简述Radon变换检测直线的原理。 Radon变换就是将数字图像矩阵在某一角度射线方向上做投影变换，按照投影方向累加像素。 2.简述基于区域生长的图像分割的原理。根…

人工智能 2023年6月18日
0079
目标检测第4步：显卡、GPU、CUDA、cuDNN的介绍及如何在Windows 10下安装cuDNN？

目录（请先看置顶博文）本博打开方式！！！请详读！！！请详读！！！请详读！！！_Cat-CSDN博客一、显卡和GPU的关系二、CUDA是什么？三、cuDNN是什么？四、cu…

人工智能 2023年7月23日
0065
Deep Learning × ECG (5) ：利用循环神经网络RNN对心律失常ECG数据进行分类

文章目录 1. RNN 介绍 2. 搭建RNN模型进行训练 RNN 介绍循环神经网络RNN的提出主要针对于时间序列数据。类似于股票、心律失常 ECG 和电力数据等数据都是属…

人工智能 2023年7月1日
00102
智能车方向环pd控制理解

位置式pd公式： p为比例项 d为微分项 ER为当前车辆与赛道中线的偏差 ERL为当前车辆与赛道中线的上次偏差方向环d的作用在智能车转向控制中，车辆的转弯主要取决于d项控制，…

人工智能 2023年6月15日
00106
残差网络(Residual Network,ResNet)原理与结构概述

残差网络是为了解决模型层数增加时出现梯度消失或梯度爆炸的问题而出现的。传统的神经网络中，尤其是图像处理方面，往往使用非常多的卷积层、池化层等，每一层都是从前一层提取特征，所以随着层…

人工智能 2023年7月28日
0051
【Pygame实战】第三版本最终确认——《愤怒的小鸟梦幻爆破》上线回归，爆赞~

前言《愤怒的小鸟》其实活得还不错，尽管我们一直在嘲笑它的IP帝国梦做得太大。但要知道，把休闲益智游戏的生意做到这个份上的，恐怕也就独此一家了。尤其还是这样的一款古早、过时、难…

人工智能 2023年6月17日
00112
Redis数据库相关指令大合集

14天学习训练营导师课程：郑为中《Vue和SpringBoot打造假日旅社管理系统》努力是为了不平庸~ 学习有些时候是枯燥的，但收获的快乐是加倍的，欢迎记录下你的那些努力时刻（…

人工智能 2023年7月31日
0065
神经网络算法基本原理及其实现

目录背景知识人工神经元模型激活函数网络结构工作状态学习方式 BP算法原理算法实现（MATLAB）背景知识在我们人体内的神经元的基本结构，相信大家并不陌生，看完下面…

人工智能 2023年7月29日
0050
回归的误差服从正态分布吗_细说回归分析

什么是回归我们先来聊聊历史，从回归这个词被发明的源头聊起。话说有一个叫高尔顿的生物学家兼统计学家在研究人类遗传问题时发现了一个现象：非常高的父亲，其儿子的身高往往要比父亲矮一点，…

人工智能 2023年6月18日
00120
EX3：逻辑回归实现手写数字识别（多类分类）

1.读取数据注意给出的数据集是以mat形式为后缀，在python中可以使用scipy.io中的函数loadmat()读取mat文件。 import numpy as np fro…

人工智能 2023年7月1日
0067
MATLAB插值

一、一维插值插值：在离散数据的基础上补插连续函数，使得这条连续曲线通过全部给定的离散数据点。 yi = interp1(x, y, xi, ‘method’) 其中interp…

人工智能 2023年6月17日
00133
基于Neo4j的担保社群型态分析挖掘

图技术 利用neo4j、networkx、dgl、python&amp…

人工智能 2023年6月1日
0084
机器学习学习笔记1（李宏毅网课）

机器学习学习笔记1 （李宏毅网课）一、Regression回归回归的目的是拟合特定的函数步骤1：建立模型 x为特征，w为权重，b为bias。步骤2：Loss Functio…

人工智能 2023年7月1日
0086
如何处理AI算法的版本管理和更新

版本管理和更新AI算法的问题在AI算法开发过程中，版本管理和更新是一个非常重要的问题。随着算法的不断改进和优化，我们需要能够方便地追踪和管理不同版本的算法，并能够快速更新算法以应…

人工智能 2024年1月3日
0054

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

猫狗识别与分类

文章目录

一、前言

二、环境配置

三、源码以及数据集

四、基础猫狗识别程序如下

1、train.py

train.py程序结构：

2、detect.py

detect.py程序结构：

五、配置环境过程

1、打开Anaconda Prompt

a、创建一个叫MNIST4的环境

b、创建成功后激活环境并下载keras包：

c、下载matplotlib包

d、下载tensorflow包

e、下载SciPy包

2、打开Pycharm配置

; 六、运行基础程序

1、运行train程序

a、将开头的程序copy进pycharm的程序中

; b、运行结果：

1、运行detect程序

a、将开头的detect程序进pycharm的程序中

; b、运行结果

七、基于DenseNet神经网络构架的猫狗识别训练程序

1、在之前的基础上导入sklearn包

2、将程序copy到pycharm

train.py程序结构

3、运行结果

大家都在看