05-图像分类（含有3700张鲜花照片的数据集）

2023年7月1日上午12:48 • 人工智能 • 阅读 81

文章目录

*
–
+ 1. 数据准备
+ 2. 配置数据集
+
* 2.1 配置数据集以提高性能
* 2.2 标准化数据
+ 3. 搭建模型
+ 4. 数据增强
+ 5. 数据预测

1. 数据准备

首先导入我们需要的包：

import matplotlib.pyplot as plt
import numpy as np
import os
import PIL
import tensorflow as tf

from tensorflow import keras
from tensorflow.keras import layers
from tensorflow.keras.models import Sequential

import pathlib

然后从网上下载数据集，本文用大约有3,700 张鲜花照片的数据集。数据集包含五个子目录，每个子目录代表一种鲜花。

dataset_url = "https://storage.googleapis.com/download.tensorflow.org/example_images/flower_photos.tgz"
data_dir = tf.keras.utils.get_file('flower_photos', origin=dataset_url, untar=True)

在这里，我们用 pathlib.Path()函数实现路径转换。

print("未使用pathlib.Path()函数路径转换前：data_dir: {}，类型为：{}".format(data_dir, type(data_dir)))
data_dir = pathlib.Path(data_dir)
print("使用pathlib.Path()函数路径转换后：data_dir: {}，类型为：{}".format(data_dir, type(data_dir)))

我们来简单看一下数据：

image_count = len(list(data_dir.glob('*/*.jpg')))
print(image_count)

data_dir.glob('*/*.jpg')这个路径涵盖 flower_photos文件夹下所有图片。上述代码可以看出这个数据集的图片总数为3670。

改变一下路径，查看一个各个子目录 data_dir.glob('sunflowers/*.jpg')涵盖的图片数量：

image_count = len(list(data_dir.glob('sunflowers/*.jpg')))
print(image_count)

同理可得，各种花卉数据集图片的数量为：

简单展示玫瑰的照片：

roses = list(data_dir.glob('roses/*'))
img0 = PIL.Image.open(str(roses[0]))
plt.imshow(img0)
plt.show()

我们使用使用 tf.keras.utils.image_dataset_from_directory将图片数据集加载存入内存，该函数的参数可参考以下文章理解：http://www.136.la/jingpin/show-164419.html


batch_size = 32
img_height = 180
img_width = 180

train_ds = tf.keras.utils.image_dataset_from_directory(
  data_dir,
  validation_split=0.2,
  subset="training",
  seed=123,
  image_size=(img_height, img_width),
  batch_size=batch_size)
print(train_ds)

val_ds = tf.keras.utils.image_dataset_from_directory(
  data_dir,
  validation_split=0.2,
  subset="validation",
  seed=123,
  image_size=(img_height, img_width),
  batch_size=batch_size)
print(val_ds)

我们可以在这些数据集的 class_names 属性中找到类名。这些对应于按字母顺序排列的目录名称。

class_names = train_ds.class_names

我们可视化一部分数据看一下，在 image_batch 和 labels_batch 张量上调用 .numpy() 可以将它们转换为 numpy.ndarray。

plt.figure(figsize=(10, 10))
for images, labels in train_ds.take(1):
  for i in range(9):
    ax = plt.subplot(3, 3, i + 1)
    plt.imshow(images[i].numpy().astype("uint8"))
    plt.title(class_names[labels[i]])
    plt.axis("off")
plt.show()

2. 配置数据集

我们通过将这些数据集传递给模型来训练模型，我们也可以手动遍历数据集和检索一批图像。

2.1 配置数据集以提高性能

Dataset.cache()将图像在第一个epoch期间从磁盘上加载后保存在内存中。这将确保数据集在训练模型时不会成为瓶颈。如果数据集太大，无法装入内存，也可以使用此方法创建一个性能磁盘缓存。
Dataset.prefetch() 在训练过程中重叠数据预处理和模型执行。


AUTOTUNE = tf.data.AUTOTUNE

train_ds = train_ds.cache().shuffle(1000).prefetch(buffer_size=AUTOTUNE)
val_ds = val_ds.cache().prefetch(buffer_size=AUTOTUNE)

2.2 标准化数据

对数据进行探索的时候，我们发现原始的像素值是 0-255， 为了模型训练更稳定以及更容易收敛，我们需要标准化数据集，一般来说就是把像素值缩放到 0-1，可以用下面的 layer 来实现：


for image_batch, labels_batch in train_ds:
  print(image_batch.shape)
  print(labels_batch.shape)
  break

normalization_layer = tf.keras.layers.Rescaling(1./255)

normalized_ds = train_ds.map(lambda x, y: (normalization_layer(x), y))
image_batch, labels_batch = next(iter(normalized_ds))
first_image = image_batch[0]

print(np.min(first_image), np.max(first_image))

这里注意，我们在使用 tf.keras.utils.image_dataset_from_directory加载数据的时候使用 image_size参数重新定义了图片的大小。这个步骤也可以定义在模型中，通过使用 tf.keras.layers.Resizing。

3. 搭建模型

该模型由三个卷积块组成，每个卷积块(tf.keras.layers.Conv2D) 中有一个最大池层。有一个完全连接的层，上面有128个单元，由一个relu激活功能激活。这个模型还没有进行高精度的调整，目标是展示一种标准的方法。

num_classes = len(class_names)

model = Sequential([
  layers.Rescaling(1./255, input_shape=(img_height, img_width, 3)),
  layers.Conv2D(16, 3, padding='same', activation='relu'),
  layers.MaxPooling2D(),
  layers.Conv2D(32, 3, padding='same', activation='relu'),
  layers.MaxPooling2D(),
  layers.Conv2D(64, 3, padding='same', activation='relu'),
  layers.MaxPooling2D(),
  layers.Flatten(),
  layers.Dense(128, activation='relu'),
  layers.Dense(num_classes)
])

用 model.summary()查看模型结构如下所示：

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param
=================================================================
rescaling_1 (Rescaling)      (None, 180, 180, 3)       0
_________________________________________________________________
conv2d (Conv2D)              (None, 180, 180, 16)      448
_________________________________________________________________
max_pooling2d (MaxPooling2D) (None, 90, 90, 16)        0
_________________________________________________________________
conv2d_1 (Conv2D)            (None, 90, 90, 32)        4640
_________________________________________________________________
max_pooling2d_1 (MaxPooling2 (None, 45, 45, 32)        0
_________________________________________________________________
conv2d_2 (Conv2D)            (None, 45, 45, 64)        18496
_________________________________________________________________
max_pooling2d_2 (MaxPooling2 (None, 22, 22, 64)        0
_________________________________________________________________
flatten (Flatten)            (None, 30976)             0
_________________________________________________________________
dense (Dense)                (None, 128)               3965056
_________________________________________________________________
dense_1 (Dense)              (None, 5)                 645
=================================================================
Total params: 3,989,285
Trainable params: 3,989,285
Non-trainable params: 0
_________________________________________________________________

接下来，我们编译并训练上述的这个模型：

model.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

epochs = 10
history = model.fit(
    train_ds,
    validation_data=val_ds,
    epochs=epochs
)

训练过程如下所示：

Epoch 1/10
92/92 [==============================] - 13s 132ms/step - loss: 1.3541 - accuracy: 0.4387 - val_loss: 1.0896 - val_accuracy: 0.5599
Epoch 2/10
92/92 [==============================] - 11s 124ms/step - loss: 0.9800 - accuracy: 0.6192 - val_loss: 0.9119 - val_accuracy: 0.6444
Epoch 3/10
92/92 [==============================] - 12s 127ms/step - loss: 0.8041 - accuracy: 0.6860 - val_loss: 0.8804 - val_accuracy: 0.6458
Epoch 4/10
92/92 [==============================] - 12s 127ms/step - loss: 0.5661 - accuracy: 0.7881 - val_loss: 0.8699 - val_accuracy: 0.6826
Epoch 5/10
92/92 [==============================] - 12s 128ms/step - loss: 0.3514 - accuracy: 0.8770 - val_loss: 0.9821 - val_accuracy: 0.6757
Epoch 6/10
92/92 [==============================] - 12s 127ms/step - loss: 0.1789 - accuracy: 0.9452 - val_loss: 1.1635 - val_accuracy: 0.6594
Epoch 7/10
92/92 [==============================] - 12s 127ms/step - loss: 0.0885 - accuracy: 0.9748 - val_loss: 1.3721 - val_accuracy: 0.6349
Epoch 8/10
92/92 [==============================] - 12s 127ms/step - loss: 0.0765 - accuracy: 0.9792 - val_loss: 1.4330 - val_accuracy: 0.6444
Epoch 9/10
92/92 [==============================] - 12s 128ms/step - loss: 0.0340 - accuracy: 0.9918 - val_loss: 1.6614 - val_accuracy: 0.6431
Epoch 10/10
92/92 [==============================] - 12s 128ms/step - loss: 0.0259 - accuracy: 0.9935 - val_loss: 1.7187 - val_accuracy: 0.6553

训练结果可视化及分析：

从图中可以看到，训练精度和验证精度相差很大，模型在验证集上仅实现了约60%的准确性。

让我们看看哪里出了问题，并尝试提高模型的整体性能。

在上面的图中，训练精度随时间线性增加，而验证精度在训练过程中停滞在60%左右。此外，训练和验证准确性之间的差异是明显的——这是过度拟合的迹象。

当训练样本数量很少时，模型有时会从训练样本的噪声或不需要的细节中学习，这在一定程度上会对模型在新样本上的性能产生负面影响。这种现象被称为 过拟合。这意味着模型在新的数据集中泛化时会有困难。

在训练过程中有多种方法可以对抗过拟合。 可以使用数据增强并将Dropout添加到我们的模型中。

4. 数据增强

数据增强主要用来防止过拟合，用于dataset较小的时候。

之前对神经网络有过了解的人都知道，虽然一个两层网络在理论上可以拟合所有的分布，但是并不容易学习得到。因此在实际中，我们通常会增加神经网络的深度和广度，从而让神经网络的学习能力增强，便于拟合训练数据的分布情况。在卷积神经网络中，有人实验得到，深度比广度更重要。

然而随着神经网络的加深，需要学习的参数也会随之增加，这样就会更容易导致过拟合，当数据集较小的时候，过多的参数会拟合数据集的所有特点，而非数据之间的共性。那什么是过拟合呢，之前的博客有提到，指的就是神经网络可以高度拟合训练数据的分布情况，但是对于测试数据来说准确率很低，缺乏泛化能力。

因此在这种情况下，为了防止过拟合现象，数据增强应运而生。当然除了数据增强，还有正则项/dropout等方式可以防止过拟合。那接下来讨论下常见的数据增强方法。

1）随机旋转：随机旋转一般情况下是对输入图像随机旋转[0,360)
2）随机裁剪：随机裁剪是对输入图像随机切割掉一部分
3）色彩抖动：色彩抖动指的是在颜色空间如RGB中，每个通道随机抖动一定的程度。在实际的使用中，该方法不常用，在很多场景下反而会使实验结果变差；
4）高斯噪声：是指在图像中随机加入少量的噪声。该方法对防止过拟合比较有效，这会让神经网络不能拟合输入图像的所有特征；
5）水平翻转；
6）竖直翻转；

随机裁剪/随机旋转/水平反转/竖直反转都是为了增加图像的多样性。并且在某些算法中，如faster RCNN中，自带了图像的翻转。

我们可以用以下方法来实现数据增强： tf.keras.layers.RandomFlip, tf.keras.layers.RandomRotation, and tf.keras.layers.RandomZoom. 这些层可以像其他层一样包含在模型中。

data_augmentation = keras.Sequential(
  [
    layers.RandomFlip("horizontal",
                      input_shape=(img_height,
                                  img_width,
                                  3)),
    layers.RandomRotation(0.1),
    layers.RandomZoom(0.1),
  ]
)

当没有大型图像数据集时，通过对训练图像应用随机但逼真的变化来人为引入样本多样性，这有助于使模型暴露于训练数据的不同方面，同时减慢过度拟合的速度。

让我们通过对同一图像多次应用数据增强来可视化一些增强示例的外观：

我们在原来模型的基础上加上数据增强及Dropout方法：

model = Sequential([
    data_augmentation,
    layers.Rescaling(1. / 255),
    layers.Conv2D(16, 3, padding='same', activation='relu'),
    layers.MaxPooling2D(),
    layers.Conv2D(32, 3, padding='same', activation='relu'),
    layers.MaxPooling2D(),
    layers.Conv2D(64, 3, padding='same', activation='relu'),
    layers.MaxPooling2D(),
    layers.Dropout(0.2),
    layers.Flatten(),
    layers.Dense(128, activation='relu'),
    layers.Dense(num_classes)
])

这一次的训练我们将 epochs的值设为15。训练结果如下所示：

我们再一次可视化训练结果：
05-图像分类（含有3700张鲜花照片的数据集）

从上图我们可以看出，应用 数据增强和 tf.keras.layers.Dropout 后，过拟合明显缓和，训练和验证准确率更接近。

5. 数据预测

最后，让我们使用我们的模型对未包含在训练或验证集中的图像进行分类。

Original: https://blog.csdn.net/Serendipity_zyx/article/details/124740035
Author: 美式咖啡不加糖x
Title: 05-图像分类（含有3700张鲜花照片的数据集）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/662394/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python opencv实现找到图像的轮廓，填充颜色

我想找到图片中的闭合圈，然后填充颜色所需要的cv函数： 1。OpenCV提供的findContours()方法可以通过计算图像梯度来判断出图像的边缘，然后将边缘的点封装成数组返回…

人工智能 2023年6月17日
00124
知识问答(KBQA)两种主流方法：基于语义解析和基于信息检索的方法介绍

什么是知识问答基于知识的问答是以知识库为认知源，在知识库的基础上回答自然语言问题。知识库（KB）是一个结构化数据库，其中包含形式 ; ‍ 例如，” Barack O…

人工智能 2023年5月27日
0080
Python作业题：组合数据类型（带有答案和详细分析过程）

本次作业涉及到的知识点获取变量地址的id函数（1 Python列表的浅复制和深复制（1 字符串join函数的使用（2 列表的遍历（3 列表元素的排序（4 列表的常用方法（5 作业…

人工智能 2023年7月31日
0073
人工智能语音实训平台实验指导书

（一）语音采集类… 21.1语音采集实验… 21.2语音波形显示实验… 71.3语音编码实验… 131.4语音采样频率转换实验&#8…

人工智能 2023年6月10日
0073
中文语音识别数据集总结

目录 OpenSLR国内镜像 1.Free ST Chinese Mandarin Corpus 2.Primewords Chinese Corpus Set 1 3.爱数智慧中…

人工智能 2023年5月27日
0098
20个Pandas数据实战案例，收获多多

今天我们讲一下pandas当中的数据过滤内容下面小编会给出大概20个案例来详细说明数据过滤的方法，首先我们先建立要用到的数据集，代码如下 import pandas as pd …

人工智能 2023年7月17日
0092
【机器学习】：Xgboost和GBDT的不同与比较

【与传统GBDT相比，XGBoost有何不同】基函数不同。GBDT只用CART树，XGBoost除了CART，也支持线性函数。目标不同。具体体现在结点分裂策略与正则化。GBDT…

人工智能 2023年6月6日
0089
Pandas数据分析——常用操作

引言 Pandas是一种常见且便捷的数据处理库，为便于使用和复习，个人针对一些常用操作进行了总结。目录引言一、pandas是什么？二、pandas常用操作有哪些？ * 1….

人工智能 2023年7月7日
0045
OpenCV的图像直角坐标系转极坐标系的函数warpPolar()详解,并附自己写的实现直角坐标系转极坐标系的MATLAB代码

【草稿】详解OpenCV实现图像直角坐标系转极坐标系的函数warpPolar(),并附自己写的实现直角坐标系转极坐标系的MATLAB代码有些时候我们需要把图像或矩阵从直角坐标系(…

人工智能 2023年7月18日
0074
Maven工程开发

目录一、Maven工程开发_构建Maven工程二、Maven工程开发_pom文件配置三、Maven工程开发_编写代码四、Maven工程开发_依赖范围一、 Maven工程开…

人工智能 2023年7月31日
0067
pandas及与matplotlib结合

文章目录 * – 一、pandas的series（一维带标签） – + 1.Series数组的创建 + 2.series的索引和值 – 二、pa…

人工智能 2023年7月8日
0077
plt.函数

1 plt.figure () ：创建画布 plt.figure(num=None, figsize=None, facecolor=None, edgecolor=None, c…

人工智能 2023年6月23日
0050
神经网络国内外发展概况,人工神经网络发展趋势

国内外人工神经网络的研究现状基于人工神经网络的土坝病害诊断知识获取方法摘要：以土坝测压管水位异常诊断为实例，对反向传播(BP)神经网络进行训练，然后通过典型示例经网络计算生成显式…

人工智能 2023年7月13日
0054
【大数据分析Hadoop + Spark 】10分钟搭建Hadoop（伪分布式）+ Spark（Local模式）环境

文章目录 Hadoop（伪分布）+ Spark（Local）软件安装及环境配置 * 前言一、安装虚拟机 – 1.下载Ubuntu16.04镜像二、Hadoop安装及…

人工智能 2023年7月15日
0073
Excel数据分析—制作客户画像

客户画像——关于客户多方面特征或信息的描述集合（1）一种分类描述客户的方式，通过对海量用户数据的分析进行更多信息的提取，帮助解决如何把数据转化为商业价值的问题。（2）构建客户画…

人工智能 2023年7月16日
00164
[scRNA-seq]doublets检测——DoubletFinder & scrublet （下）

在上一篇文章里我们聊到为什么要进行doublet检测以及DoubletFinder的基本原理。在这篇文章里，我们就来聊聊另一个doublet检测工具——scrublet的基本算法、…

人工智能 2023年6月19日
0081

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30