基于Python实现的口罩佩戴检测

口罩佩戴检测

设计报告和源码下载地址:https://download.csdn.net/download/sheziqiong/85594224

一 题目背景

1.1 实验介绍

今年一场席卷全球的新型冠状病毒给人们带来了沉重的生命财产的损失。有效防御这种传染病毒的方法就是积极佩戴口罩。我国对此也采取了严肃的措施,在公共场合要求人们必须佩戴口罩。在本次实验中,我们要建立一个目标检测的模型,可以识别图中的人是否佩戴了口罩。

1.2 实验要求

  • 建立深度学习模型,检测出图中的人是否佩戴了口罩,并将其尽可能调整到最佳状态。
  • 学习经典的模型 MTCNNMobileNet 的结构。
  • 学习训练时的方法。

1.3 实验环境

实验使用重要 _python_包:

import cv2 as cv
import numpy as np
import matplotlib.pyplot as plt
from tensorflow.keras.callbacks import ModelCheckpoint, ReduceLROnPlateau, EarlyStopping

由于担心平台 GPU_时长不够用,所以在自己电脑上搭建了配套实验环境,由于电脑显卡 CUDA_版本较老,所以最终本地配置如下:

  • Python: 3.8
  • Tensorflow-GPU: 2.3.0
  • Keras: 2.7.0

1.4 实验思路

针对目标检测的任务,可以分为两个部分:目标识别和位置检测。通常情况下,特征提取需要由特有的特征提取神经网络来完成,如 VGG、MobileNet、ResNet 等,这些特征提取网络往往被称为 Backbone 。而在 BackBone 后面接全连接层(FC)就可以执行分类任务。但 FC 对目标的位置识别乏力。经过算法的发展,当前主要以特定的功能网络来代替 FC 的作用,如 Mask-Rcnn、SSD、YOLO 等。我们选择充分使用已有的人脸检测的模型,再训练一个识别口罩的模型,从而提高训练的开支、增强模型的准确率。

常规目标检测:

基于Python实现的口罩佩戴检测

本次案例:

基于Python实现的口罩佩戴检测

图1 实验口罩佩戴检测流程

; 二 实验内容

2.1 已知文件与数据集

首先,导入已经写好的 _python_文件并对数据集进行处理。

  • image 文件夹:图片分成两类,戴口罩的和没有戴口罩的
  • train.txt: 存放的是 image 文件夹下对应图片的标签
  • keras_model_data 文件夹:存放 keras 框架相关预训练好的模型

2.2 图片尺寸调整

将图片尺寸调整到网络输入的图片尺寸

2.3 制作训练时需要用到的批量数据集

图片生成器的主要方法:

  • fit(x, augment=False, rounds=1):计算依赖于数据的变换所需要的统计信息(均值方差等)。
  • flow(self, X, y, batch_size=32, shuffle=True, seed=None, save_to_dir=None, save_prefix='', save_format='png'):接收 Numpy 数组和标签为参数,生成经过数据提升或标准化后的 batch 数据,并在一个无限循环中不断的返回 batch 数据。
  • flow_from_directory(directory): 以文件夹路径为参数,会从路径推测 label,生成经过数据提升/归一化后的数据,在一个无限循环中无限产生 batch 数据。

结果:

Found 693 images belonging to 2 classes.

Found 76 images belonging to 2 classes.

{'mask': 0, 'nomask': 1}
{0: 'mask', 1: 'nomask'}

2.4 调用MTCNN

通过搭建 MTCNN 网络实现人脸检测

  • keras_py/mtcnn.py 文件是在搭建 MTCNN 网络。
  • keras_py/face_rec.py 文件是在绘制人脸检测的矩形框。

    这里直接使用现有的表现较好的 MTCNN 的三个权重文件,它们已经保存在 datasets/5f680a696ec9b83bb0037081-momodel/data/keras_model_data 文件夹下

2.5 加载预训练模型MobileNet


weights_path = basic_path + 'keras_model_data/mobilenet_1_0_224_tf_no_top.h5'

2.6 训练模型

2.6.1 加载和保存

为了避免训练过程中遇到断电等突发事件,导致模型训练成果无法保存。我们可以通过 ModelCheckpoint规定在固定迭代次数后保存模型。同时,我们设置在下一次重启训练时,会检查是否有上次训练好的模型,如果有,就先加载已有的模型权重。这样就可以在上次训练的基础上继续模型的训练了。

2.6.2 手动调整学习率

学习率的手动设置可以使模型训练更加高效。这里我们设置当模型在三轮迭代后,准确率没有上升,就调整学习率。


reduce_lr = ReduceLROnPlateau(
                        monitor='accuracy',
                        factor=0.5,
                        patience=3,
                        verbose=2
                    )
2.6.3 早停法

当我们训练深度学习神经网络的时候通常希望能获得最好的泛化性能。但是所有的标准深度学习神经网络结构如全连接多层感知机都很容易过拟合。当网络在训练集上表现越来越好,错误率越来越低的时候,就极有可能出现了过拟合。早停法就是当我们在检测到这一趋势后,就停止训练,这样能避免继续训练导致过拟合的问题。

early_stopping = EarlyStopping(
                            monitor='val_accuracy',
                            min_delta=0.0001,
                            patience=3,
                            verbose=1
                        )
2.6.4 乱序训练数据

打乱 txt的行,这个 txt主要用于帮助读取数据来训练,打乱的数据更有利于训练。

    np.random.seed(10101)
    np.random.shuffle(lines)
    np.random.seed(None)
2.6.5 训练模型

一次训练集大小设定为64,优化器使用 Adam,初始学习率设定为0.001,优化目标为 accuracy,总的学习轮次设定为20轮。(通过多次实验测定,在这些参数条件下,准确率较高)


batch_size = 64

model.compile(loss='binary_crossentropy',
              optimizer=Adam(lr=0.001),
              metrics=['accuracy'])

history = model.fit(train_generator,
                    epochs=20,

                    steps_per_epoch=637 // batch_size,
                    validation_data=test_generator,
                    validation_steps=70 // batch_size,
                    initial_epoch=0,
                    callbacks=[checkpoint_period, reduce_lr])

三 算法描述

3.1 MTCNN

  • 三阶段的级联(cascaded)架构
  • coarse-to-fine 的方式
  • new online hard sample mining 策略
  • 同时进行人脸检测和人脸对齐
  • *state-of-the-art 性能

基于Python实现的口罩佩戴检测

图2 MTCNN架构

; 3.2 MobileNet

基于Python实现的口罩佩戴检测

图3 MobileNet架构

_MobileNet_的网络结构如图3所示。首先是一个 3x3的标准卷积,然后后面就是堆积 depthwise separable convolution,并且可以看到其中的部分 depthwise convolution会通过 strides=2进行 down sampling。然后采用 average poolingfeature变成 1x1,根据预测类别大小加上全连接层,最后是一个 softmax层。

四 求解结果

最终确定最佳取值为 batch_size=64lr=0.0001epochs=20,其它参数如下,连续训练两次,可以获得最佳结果。此处仅展示两个参数条件下的结果作为对比


batch_size = 64

model.compile(loss='binary_crossentropy',
              optimizer=Adam(lr=0.001),
              metrics=['accuracy'])

history = model.fit(train_generator,
                    epochs=20,

                    steps_per_epoch=637 // batch_size,
                    validation_data=test_generator,
                    validation_steps=70 // batch_size,
                    initial_epoch=0,
                    callbacks=[checkpoint_period, reduce_lr])
条件1:
batch_size=48 , lr=0.001epochs=20 ,对训练之后的模型进行测试,得到结果如下:

基于Python实现的口罩佩戴检测

图4 条件1 loss曲线

loss曲线可以看出,随着训练迭代次数的加深,验证集上的损失在逐渐的减小,最终稳定在0.2左右;而在训练集上 loss始终在0附近。

基于Python实现的口罩佩戴检测

图5 条件1 acc曲线

从验证集和测试集的准确率变化曲线上可以看出,随着训练轮次的增加,验证集的准确率逐渐上升,最终稳定在96%左右,效果还是不错的。

基于Python实现的口罩佩戴检测

图6 条件1 测试样例1

使用样例照片进行测试,首先人脸识别部分顺利识别到了五张人脸,但是口罩识别部分将一个没有带口罩的人识别成了带着口罩的人,说明还有进步空间,实际错误率达到了20%。

基于Python实现的口罩佩戴检测

图7 条件1 测试样例2

另一张样例照片的测试结果同样是人脸识别部分没有出现问题,正确识别到了四张人脸,但是同样将一个没有带口罩的人识别成了带有口罩的人。

; 平台测试:

基于Python实现的口罩佩戴检测

后续通过调整各项参数并打乱测试集和训练集图片顺序来进行了多次实验,最终确定的最佳状态如下:

条件2:
batch_size=64 , lr=0.0001epochs=20 ,对训练之后的模型进行测试,得到结果如下:

基于Python实现的口罩佩戴检测

图8 条件2 loss曲线

观察准确率曲线可以看出,在该条件下,验证集上的准确率最终稳定在98%附近,效果非常的好,说明我们做出的一些优化还是具有一定效果的。

基于Python实现的口罩佩戴检测

图9 条件2 acc曲线

观察此条件下的 loss曲线可以看到最终验证集的 loss稳定在0.2左右,训练集的 loss非常小,基本趋近于0

基于Python实现的口罩佩戴检测

图10 条件2 测试样例1

使用两张测试样例对模型进行检测,第一张图片所有检测点均正确,正确识别出了五张人脸并且口罩佩戴检测均正确,识别正确率100%。

基于Python实现的口罩佩戴检测

图11 条件2 测试样例2

第二章测试样例上,正确识别出了4张人脸并且口罩佩戴检测结果均正确。

两张测试样例上所有检测点检测结果均正确,说明在此参数条件下,模型识别效果较好,达到了口罩佩戴检测的要求。

; 平台测试:

基于Python实现的口罩佩戴检测
条件3:

使用更多测试样例发现 _MTCNN_人脸识别部分存在不能正确识别人脸的问题,故通过多次实验和测试,修改了 mask_rec()的门限函数权重 self.threshold,由原来的 self.threshold = [0.5,0.6,0.8] 修改为 self.threshold = [0.4,0.15,0.65]

在本地使用更多自选图片进行测试,发现人脸识别准确率有所提升。在条件2训练参数不变的情况下,使用同一模型进行平台测试,结果如下:

基于Python实现的口罩佩戴检测

平台测试成绩有所提升。

; 条件4:

继续调整 mask_rec()的门限函数权重 self.threshold,通过系统测试反馈来决定门限函数的权重,通过多次测试,由原来的 self.threshold = [0.4,0.15,0.65] 修改为 self.threshold = [0.4,0.6,0.65]

平台测试,结果如下:

基于Python实现的口罩佩戴检测

平台测试成绩有所提升,达到95分。

为了达到条件4所展示的效果,对门限函数的数值进行了大量的尝试,根据提交测试的反馈结果,最终确定数值为条件4时,可以达到最优。由于不知道后台测试图片是什么且没有反馈数据,所以最终再次修改人脸识别的门限函数或者修改参数重新训练口罩识别模型依旧没有提升。

五 比较分析

验证集准确率测试样例结果平台成绩
条件1

96%7/977.5
条件2

98%9/988.33333334
条件3

98%9/990
条件4

98%9/995

最终通过不断调试与优化算法,得到了95分的平台成绩。

六 心得与感想

本次实验过程中主要使用了 keras_方法进行训练,由于初次使用这些方法,所以前期实现的过程相对困难。最初我想通过调用 GPU资源来进行训练,所以给自己的电脑配套安装了 tensorflow-gpu、CUDA等等配套的软件和包,由于个人电脑的显卡版本较老,所以安装的过程也是非常的曲折。好在最终安装好了所有的东西,但是由于显卡显存比较小,所以 bath_size大小一直上不去,最大只能给到32,不过影响也不大。调整参数的过程花费了很多的时间,优化算法也花费了很多的时间。之后又对门限函数进行了修改,虽然过程非常的辛苦,但最终的结果还是很不错的,最终整体达到 95_分,在两张给定的测试样例上所有检测点都是正确的,由于不知道平台的五张检测照片是什么,所以不知道到底出错在哪里,希望之后平台可以反馈一些修改意见~。总的来说在过程中收获还是很大的,受益匪浅。

训练源代码:

import warnings

warnings.filterwarnings('ignore')
import os
import matplotlib
import cv2 as cv
import numpy as np
import matplotlib.pyplot as plt
from tensorflow.keras.callbacks import ModelCheckpoint, ReduceLROnPlateau, EarlyStopping
from tensorflow.keras.applications.imagenet_utils import preprocess_input
from tensorflow.keras import backend as K
from tensorflow.keras.optimizers import Adam
K.image_data_format() == 'channels_last'
from keras_py.utils import get_random_data
from keras_py.face_rec import mask_rec
from keras_py.face_rec import face_rec
from keras_py.mobileNet import MobileNet
from tensorflow.keras.preprocessing.image import ImageDataGenerator

basic_path = "./datasets/5f680a696ec9b83bb0037081-momodel/data/"

def letterbox_image(image, size):
    new_image = cv.resize(image, size, interpolation=cv.INTER_AREA)
    return new_image
read_img = cv.imread("test1.jpg")
print("调整前图片的尺寸:", read_img.shape)
read_img = letterbox_image(image=read_img, size=(50, 50))
print("调整前图片的尺寸:", read_img.shape)

def processing_data(data_path, height, width, batch_size=32, test_split=0.1):

    train_data = ImageDataGenerator(

            rescale=1. / 255,

            shear_range=0.1,

            zoom_range=0.1,

            width_shift_range=0.1,

            height_shift_range=0.1,

            horizontal_flip=True,

            vertical_flip=True,

            validation_split=test_split
    )

    test_data = ImageDataGenerator(
            rescale=1. / 255,
            validation_split=test_split)

    train_generator = train_data.flow_from_directory(

            data_path,

            target_size=(height, width),

            batch_size=batch_size,

            class_mode='categorical',

            subset='training',
            seed=0)
    test_generator = test_data.flow_from_directory(
            data_path,
            target_size=(height, width),
            batch_size=batch_size,
            class_mode='categorical',
            subset='validation',
            seed=0)

    return train_generator, test_generator

data_path = basic_path + 'image'

height, width = 160, 160

train_generator, test_generator = processing_data(data_path, height, width)

labels = train_generator.class_indices
print(labels)

labels = dict((v, k) for k, v in labels.items())
print(labels)
pnet_path = "./datasets/5f680a696ec9b83bb0037081-momodel/data/keras_model_data/pnet.h5"
rnet_path = "./datasets/5f680a696ec9b83bb0037081-momodel/data/keras_model_data/rnet.h5"
onet_path = "./datasets/5f680a696ec9b83bb0037081-momodel/data/keras_model_data/onet.h5"

weights_path = basic_path + 'keras_model_data/mobilenet_1_0_224_tf_no_top.h5'

height, width = 160, 160
model = MobileNet(input_shape=[height,width,3],classes=2)
model.load_weights(weights_path,by_name=True)
print('加载完成...')
def save_model(model, checkpoint_save_path, model_dir):

    if os.path.exists(checkpoint_save_path):
        print("模型加载中")
        model.load_weights(checkpoint_save_path)
        print("模型加载完毕")
    checkpoint_period = ModelCheckpoint(

        model_dir + 'ep{epoch:03d}-loss{loss:.3f}-val_loss{val_loss:.3f}.h5',

        monitor='val_acc',

        mode='max',

        save_weights_only=False,

        save_best_only=True,

        period=2
    )
    return checkpoint_period
checkpoint_save_path = "./results/last_one88.h5"
model_dir = "./results/"
checkpoint_period = save_model(model, checkpoint_save_path, model_dir)

reduce_lr = ReduceLROnPlateau(
                        monitor='accuracy',
                        factor=0.5,
                        patience=3,
                        verbose=2
                    )
early_stopping = EarlyStopping(
                            monitor='val_accuracy',
                            min_delta=0.0001,
                            patience=3,
                            verbose=1
                        )

batch_size = 64

data_path = basic_path + 'image'

train_generator, test_generator = processing_data(data_path, height=160, width=160, batch_size=batch_size, test_split=0.1)

model.compile(loss='binary_crossentropy',
              optimizer=Adam(lr=0.001),
              metrics=['accuracy'])

history = model.fit(train_generator,
                    epochs=20,

                    steps_per_epoch=637 // batch_size,
                    validation_data=test_generator,
                    validation_steps=70 // batch_size,
                    initial_epoch=0,
                    callbacks=[checkpoint_period, reduce_lr])

model.save_weights(model_dir + 'temp.h5')
plt.plot(history.history['loss'],label = 'train_loss')
plt.plot(history.history['val_loss'],'r',label = 'val_loss')
plt.legend()
plt.show()

plt.plot(history.history['accuracy'],label = 'acc')
plt.plot(history.history['val_accuracy'],'r',label = 'val_acc')
plt.legend()
plt.show()

设计报告和源码下载地址:https://download.csdn.net/download/sheziqiong/85594224

Original: https://blog.csdn.net/newlw/article/details/124897861
Author: biyezuopinvip
Title: 基于Python实现的口罩佩戴检测

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/624484/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球