卷积神经网络——猫狗分类

2023年7月2日下午3:45 • 人工智能 • 阅读 68

实验目的：
1.按照网上教程,利用TensorFlow和Keras，自己搭建卷积神经网络完成狗猫数据集的分类实验（将关键步骤注释出来）。
附加问题：解释什么是overfit（过拟合）？什么是数据增强？如果单独只做数据增强，精确率提高了多少？然后再添加的dropout层，是什么实际效果？
2.用Vgg19网络模型完成狗猫分类，写出实验结果。
实验环境：Anaconda，jupyter notebook，python3.x虚拟环境的安装
参考资料：【TensorFlow&Keras】入门猫狗数据集实验–理解卷积神经网络CNN
windows10（64位）Anaconda3+Python3.6搭建Tensorflow（cpu版本）及keras+用Jupyter notebook运行Kaggle狗猫数据集+提高模分类模型精度

一、搭建环境，完成猫狗分类

这里推荐一个jupyter_contrib_nbextensions插件，可以很方便地编辑jupyter

一）安装TensorFlow和Keras

有两种方法可以安装：

1.Anaconda中安装

安什么包最好自己搜索一下，免得版本不相容。

; 2.cmd中安装

专业人士谁用UI啊，都用cmd

Files->New->Teminal

使用命令

pip install tensorflow
pip install keras

然后测试

import tensorflow as tf
tf.__version__

import keras
keras.__version__

二）猫狗分类实验

1.先制作数据集

常用的是kaggle网站的数据集（参考资料里面找猫狗数据集）
图片分类：

import os, shutil
#训练文件路径,数据不能压缩
original_dataset_dir = 'E:/01work_area/hml/hml13/kaggle_Dog&Cat/train'

#存储我们数据集的位置
base_dir = 'E:/01work_area/hml/hml13/kaggle_Dog&Cat/find_cats_and_dogs'
os.mkdir(base_dir)

#我们训练的路径，验证和测试拆分开做
train_dir = os.path.join(base_dir, 'train')
os.mkdir(train_dir)
validation_dir = os.path.join(base_dir, 'validation')
os.mkdir(validation_dir)
test_dir = os.path.join(base_dir, 'test')
os.mkdir(test_dir)

#训练用的猫片存放的路径
train_cats_dir = os.path.join(train_dir, 'cats')
os.mkdir(train_cats_dir)

#训练用的狗的图片存放的路径
train_dogs_dir = os.path.join(train_dir, 'dogs')
os.mkdir(train_dogs_dir)

#验证用的猫片存放的路径
validation_cats_dir = os.path.join(validation_dir, 'cats')
os.mkdir(validation_cats_dir)

#验证用的狗的图片存放的路径
validation_dogs_dir = os.path.join(validation_dir, 'dogs')
os.mkdir(validation_dogs_dir)

#测试用的猫片存放的路径
test_cats_dir = os.path.join(test_dir, 'cats')
os.mkdir(test_cats_dir)

#测试用的狗的图片存放的路径
test_dogs_dir = os.path.join(test_dir, 'dogs')
os.mkdir(test_dogs_dir)

#将前面的1000张猫片复制到 train_cats_dir
fnames = ['cat.{}.jpg'.format(i) for i in range(1000)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(train_cats_dir, fname)
    shutil.copyfile(src, dst)

#将接下来的500张猫片复制到 validation_cats_dir
fnames = ['cat.{}.jpg'.format(i) for i in range(1000, 1500)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(validation_cats_dir, fname)
    shutil.copyfile(src, dst)

#将接下来的500张猫片复制到 test_cats_dir
fnames = ['cat.{}.jpg'.format(i) for i in range(1500, 2000)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(test_cats_dir, fname)
    shutil.copyfile(src, dst)

#将前面的1000张狗的图片复制到 train_dogs_dir
fnames = ['dog.{}.jpg'.format(i) for i in range(1000)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(train_dogs_dir, fname)
    shutil.copyfile(src, dst)

#将后面的500张狗的图片复制到 validation_dogs_dir
fnames = ['dog.{}.jpg'.format(i) for i in range(1000, 1500)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(validation_dogs_dir, fname)
    shutil.copyfile(src, dst)

#将后面的500张狗的图片复制到 test_dogs_dir
fnames = ['dog.{}.jpg'.format(i) for i in range(1500, 2000)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(test_dogs_dir, fname)
    shutil.copyfile(src, dst)

分类后会有几个目录，分别是find_cats_and_dogs，里面有test，train，validation。自己去验证，我不多讲。

#统计图片数量
print('total training cat images:', len(os.listdir(train_cats_dir)))
print('total training dog images:', len(os.listdir(train_dogs_dir)))
print('total validation cat images:', len(os.listdir(validation_cats_dir)))
print('total validation dog images:', len(os.listdir(validation_dogs_dir)))
print('total test cat images:', len(os.listdir(test_cats_dir)))
print('total test dog images:', len(os.listdir(test_dogs_dir)))

根据图片数量进一步验证数据集。

2.卷积神经网络CNN

（1）网络模型搭建

from keras import layers
from keras import models

model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), activation='relu',
                        input_shape=(150, 150, 3)))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(128, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(128, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Flatten())
model.add(layers.Dense(512, activation='relu'))
model.add(layers.Dense(1, activation='sigmoid'))
model.summary()
#model.summary()输出模型各层的参数状况

（2）读取文件数据，进行预处理

from keras import optimizers

#model.compile()优化器
#(loss：计算损失，这里用的是交叉熵损失,metrics: 列表，包含评估模型在训练和测试时的性能的指标)
model.compile(loss='binary_crossentropy',
              optimizer=optimizers.RMSprop(lr=1e-4),
              metrics=['acc'])
from keras.preprocessing.image import ImageDataGenerator

所有图像将按1/255重新缩放
train_datagen = ImageDataGenerator(rescale=1./255)
test_datagen = ImageDataGenerator(rescale=1./255)

train_generator = train_datagen.flow_from_directory(
        # 这是目标目录
        train_dir,
        # 所有图像将调整为150x150
        target_size=(150, 150),
        batch_size=20,
        # 因为我们使用二元交叉熵损失，我们需要二元标签
        class_mode='binary')

validation_generator = test_datagen.flow_from_directory(
        validation_dir,
        target_size=(150, 150),
        batch_size=20,
        class_mode='binary')

#在某个点上中断迭代循环
for data_batch, labels_batch in train_generator:
    print('data batch shape:', data_batch.shape)
    print('labels batch shape:', labels_batch.shape)
    break

（3）训练模型

#开始训练
history = model.fit_generator(
      train_generator,
      steps_per_epoch=100,
      epochs=30,
      validation_data=validation_generator,
      validation_steps=50)

需要训练很久（根据电脑而异）

（4）保存模型

model.save('E:/01work_area/hml/hml13/cats_and_dogs_small_1.h5')

后面的我做不了了，电脑太慢太卡了。

三）附加问题

二、Vgg19实现猫狗分类

Original: https://blog.csdn.net/qqq080/article/details/117660671
Author: 管它的
Title: 卷积神经网络——猫狗分类

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/665735/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

3060显卡下CUDA+CUDNN+Paddle安装的血泪史

3060显卡下CUDA+CUDNN+Paddle安装的血泪史 项目相关&#x80CC…

人工智能 2023年5月26日
0087
python优化

apply DataFrame.apply(func, axis=0, raw=False, result_type=None, args=(), **kwargs) axis=0…

人工智能 2023年7月9日
0069
6款支持中文语音识别开源软件的简单使用

文章目录前言一、PaddleSpeech * 1.1 安装 1.2 运行 1.3 更多功能二、ASRT * 2.1 安装 2.2 运行三、MASR * 3.1 安装 3.2…

人工智能 2023年6月24日
0084
论文阅读：VectorNet: Encoding HD Maps and Agent Dynamics fromVectorized Representation

摘要：本文介绍了VectorNet，这是一个层次化的图神经网络，它首先利用了由向量表示的单个道路组件的空间位置，然后对所有组件之间的高阶相互作用进行建模。最近的方法是将运动物体的…

人工智能 2023年7月27日
0050
深度学习传统CV算法——一阶微分边缘算子

一阶微分边缘算子详解一阶微分边缘算子 * 一阶微分边缘算子基本思想 Roberts 算子 – Roberts 算法思想 Roberts 算法步骤 Roberts 算子…

人工智能 2023年6月22日
0078
C#_Halcon 实现对图像的处理

通过C#与Halcon混编实现图像的显示、ROI区域画圆、通过线程采集本地图像、计算圆形区域的半径、UI显示计算结果、存储结果到本地csv文件。 using System;usin…

人工智能 2023年6月18日
00106
图像修复（Image Inpainting）任务中常用的掩码数据集

文章目录前言 mask数据集分类及介绍总结前言在 Image Inpainting（图像修复）任务中，需要使用掩码数据集在图像上人为添加缺陷区域，以便在设计的深度学习上进…

人工智能 2023年7月28日
0060
独孤九剑第五式-朴素贝叶斯模型

💐文章适合于所有的相关人士进行学习💐🍀各位看官看完了之后不要立刻转身呀🍀🌿期待三连关注小小博主加收藏🌿🍃小小博主回关快会给你意想不到的惊喜呀🍃各位老板动动小手给小弟点赞收藏一下，…

人工智能 2023年6月13日
0054
《R语言与数据挖掘》⑤高级绘图工具【lattice包】【ggplot2】【交互式】

书籍：《R语言与数据挖掘》作者：张良均出版社：机械工业出版社 ISBN：9787111540526 本书由北京华章图文信息有限公司授权杭州云悦读网络有限公司电子版制作与发行版…

人工智能 2023年7月17日
0064
编程实战（4）——python识别图像中的坐标点并保存坐标数据

编程实战（4）——python识别图像中的坐标点并保存坐标数据文章目录编程实战（4）——python识别图像中的坐标点并保存坐标数据 * – 综述代码思路 + 库…

人工智能 2023年6月18日
0080
几分钟实现对恶意IP地址进行拦截，腾讯云Web防火墙实在太香了！

一、概述在平时上网中，我们经常听到”xxx被拉入黑名单”、”把xxx加入白名单”，黑白名单成了禁止访问和允许访问的代名词，黑白名单…

人工智能 2023年6月28日
0073
【我是土堆 – PyTorch教程】学习随手记

目录 1. Pytorch环境的配置及安装如何管理项目环境？如何看自己电脑cuda版本？安装Pytorch 2. Python编辑器的选择、安装及配置 PyCharm PyC…

人工智能 2023年6月23日
0075
YARP+AgileConfig 5分钟实现一个支持配置热更新的代理网关

YARP 是微软开源的一个反向代理项目，英文名叫 Yet Another Reverse Proxy 。所谓反向代理最有名的那就是 nginx 了，没错 YARP 也可以用来完成 …

人工智能 2023年6月6日
0080
人工晶状体计算——人工智能算法（R语言）

人工晶状体计算——人工智能算法（R语言） 1. 准备数据 2. 建立模型 2.1 方法1 2.2 方法2 准备数据准备数据Data.xlsx，示例如图 Age AL ACD K1…

人工智能 2023年7月14日
0068
数据挖掘-支持向量机(SVM)+代码实现

🤵‍♂️ 个人主页：@Lingxw_w的个人主页✍🏻作者简介：计算机科学与技术研究生在读🐋 希望大家多多支持，我们一起进步！😄如果文章对你有帮助的话，欢迎评论 💬点赞👍🏻 收藏 📂…

人工智能 2023年7月18日
0062
【深度学习】（四）目标检测——上篇

; 目标检测——上篇🍉 文章目录 * – 目标检测——上篇🍉* 前言🎆* 一、目标检测是什么？* 二、目标检测的发展历程* 三、区域卷积神经网络（R-CNN）系列* &…

人工智能 2023年6月23日
0051

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31