基于Python实现的口罩佩戴检测

2023年6月16日下午1:42 • 人工智能 • 阅读 109

口罩佩戴检测

设计报告和源码下载地址：https://download.csdn.net/download/sheziqiong/85594224

一题目背景

1.1 实验介绍

今年一场席卷全球的新型冠状病毒给人们带来了沉重的生命财产的损失。有效防御这种传染病毒的方法就是积极佩戴口罩。我国对此也采取了严肃的措施，在公共场合要求人们必须佩戴口罩。在本次实验中，我们要建立一个目标检测的模型，可以识别图中的人是否佩戴了口罩。

1.2 实验要求

建立深度学习模型，检测出图中的人是否佩戴了口罩，并将其尽可能调整到最佳状态。
学习经典的模型 MTCNN 和 MobileNet 的结构。
学习训练时的方法。

1.3 实验环境

实验使用重要 _python_包：

import cv2 as cv
import numpy as np
import matplotlib.pyplot as plt
from tensorflow.keras.callbacks import ModelCheckpoint, ReduceLROnPlateau, EarlyStopping

由于担心平台 GPU_时长不够用，所以在自己电脑上搭建了配套实验环境，由于电脑显卡 CUDA_版本较老，所以最终本地配置如下：

Python： 3.8
Tensorflow-GPU： 2.3.0
Keras: 2.7.0

1.4 实验思路

针对目标检测的任务，可以分为两个部分：目标识别和位置检测。通常情况下，特征提取需要由特有的特征提取神经网络来完成，如 VGG、MobileNet、ResNet 等，这些特征提取网络往往被称为 Backbone 。而在 BackBone 后面接全连接层(FC)就可以执行分类任务。但 FC 对目标的位置识别乏力。经过算法的发展，当前主要以特定的功能网络来代替 FC 的作用，如 Mask-Rcnn、SSD、YOLO 等。我们选择充分使用已有的人脸检测的模型，再训练一个识别口罩的模型，从而提高训练的开支、增强模型的准确率。

常规目标检测：

本次案例：

图1 实验口罩佩戴检测流程

; 二实验内容

2.1 已知文件与数据集

首先，导入已经写好的 _python_文件并对数据集进行处理。

image 文件夹：图片分成两类，戴口罩的和没有戴口罩的
train.txt：存放的是 image 文件夹下对应图片的标签
keras_model_data 文件夹：存放 keras 框架相关预训练好的模型

2.2 图片尺寸调整

将图片尺寸调整到网络输入的图片尺寸

2.3 制作训练时需要用到的批量数据集

图片生成器的主要方法：

fit(x, augment=False, rounds=1)：计算依赖于数据的变换所需要的统计信息(均值方差等)。
flow(self, X, y, batch_size=32, shuffle=True, seed=None, save_to_dir=None, save_prefix='', save_format='png')：接收 Numpy 数组和标签为参数,生成经过数据提升或标准化后的 batch 数据，并在一个无限循环中不断的返回 batch 数据。
flow_from_directory(directory): 以文件夹路径为参数，会从路径推测 label，生成经过数据提升/归一化后的数据，在一个无限循环中无限产生 batch 数据。

结果：

Found 693 images belonging to 2 classes.

Found 76 images belonging to 2 classes.

{'mask': 0, 'nomask': 1}
{0: 'mask', 1: 'nomask'}

2.4 调用MTCNN

通过搭建 MTCNN 网络实现人脸检测

keras_py/mtcnn.py 文件是在搭建 MTCNN 网络。
keras_py/face_rec.py 文件是在绘制人脸检测的矩形框。

这里直接使用现有的表现较好的 MTCNN 的三个权重文件，它们已经保存在 datasets/5f680a696ec9b83bb0037081-momodel/data/keras_model_data 文件夹下

2.5 加载预训练模型MobileNet


weights_path = basic_path + 'keras_model_data/mobilenet_1_0_224_tf_no_top.h5'

2.6 训练模型

2.6.1 加载和保存

为了避免训练过程中遇到断电等突发事件，导致模型训练成果无法保存。我们可以通过 ModelCheckpoint规定在固定迭代次数后保存模型。同时，我们设置在下一次重启训练时，会检查是否有上次训练好的模型，如果有，就先加载已有的模型权重。这样就可以在上次训练的基础上继续模型的训练了。

2.6.2 手动调整学习率

学习率的手动设置可以使模型训练更加高效。这里我们设置当模型在三轮迭代后，准确率没有上升，就调整学习率。


reduce_lr = ReduceLROnPlateau(
                        monitor='accuracy',
                        factor=0.5,
                        patience=3,
                        verbose=2
                    )

2.6.3 早停法

当我们训练深度学习神经网络的时候通常希望能获得最好的泛化性能。但是所有的标准深度学习神经网络结构如全连接多层感知机都很容易过拟合。当网络在训练集上表现越来越好，错误率越来越低的时候，就极有可能出现了过拟合。早停法就是当我们在检测到这一趋势后，就停止训练，这样能避免继续训练导致过拟合的问题。

early_stopping = EarlyStopping(
                            monitor='val_accuracy',
                            min_delta=0.0001,
                            patience=3,
                            verbose=1
                        )

2.6.4 乱序训练数据

打乱 txt的行，这个 txt主要用于帮助读取数据来训练，打乱的数据更有利于训练。

    np.random.seed(10101)
    np.random.shuffle(lines)
    np.random.seed(None)

2.6.5 训练模型

一次训练集大小设定为64，优化器使用 Adam，初始学习率设定为0.001，优化目标为 accuracy，总的学习轮次设定为20轮。（通过多次实验测定，在这些参数条件下，准确率较高）


batch_size = 64

model.compile(loss='binary_crossentropy',
              optimizer=Adam(lr=0.001),
              metrics=['accuracy'])

history = model.fit(train_generator,
                    epochs=20,

                    steps_per_epoch=637 // batch_size,
                    validation_data=test_generator,
                    validation_steps=70 // batch_size,
                    initial_epoch=0,
                    callbacks=[checkpoint_period, reduce_lr])

三算法描述

3.1 MTCNN

三阶段的级联（cascaded）架构
coarse-to-fine 的方式
new online hard sample mining 策略
同时进行人脸检测和人脸对齐
*state-of-the-art 性能

图2 MTCNN架构

; 3.2 MobileNet

图3 MobileNet架构

_MobileNet_的网络结构如图3所示。首先是一个 3x3的标准卷积，然后后面就是堆积 depthwise separable convolution，并且可以看到其中的部分 depthwise convolution会通过 strides=2进行 down sampling。然后采用 average pooling将 feature变成 1x1，根据预测类别大小加上全连接层，最后是一个 softmax层。

四求解结果

最终确定最佳取值为 batch_size=64， lr=0.0001， epochs=20，其它参数如下，连续训练两次，可以获得最佳结果。此处仅展示两个参数条件下的结果作为对比


batch_size = 64

model.compile(loss='binary_crossentropy',
              optimizer=Adam(lr=0.001),
              metrics=['accuracy'])

history = model.fit(train_generator,
                    epochs=20,

                    steps_per_epoch=637 // batch_size,
                    validation_data=test_generator,
                    validation_steps=70 // batch_size,
                    initial_epoch=0,
                    callbacks=[checkpoint_period, reduce_lr])

条件1：

取 `batch_size=48` , `lr=0.001` ， `epochs=20` ，对训练之后的模型进行测试，得到结果如下：

图4 条件1 loss曲线

由 loss曲线可以看出，随着训练迭代次数的加深，验证集上的损失在逐渐的减小，最终稳定在0.2左右；而在训练集上 loss始终在0附近。

图5 条件1 acc曲线

从验证集和测试集的准确率变化曲线上可以看出，随着训练轮次的增加，验证集的准确率逐渐上升，最终稳定在96%左右，效果还是不错的。

图6 条件1 测试样例1

使用样例照片进行测试，首先人脸识别部分顺利识别到了五张人脸，但是口罩识别部分将一个没有带口罩的人识别成了带着口罩的人，说明还有进步空间，实际错误率达到了20%。

图7 条件1 测试样例2

另一张样例照片的测试结果同样是人脸识别部分没有出现问题，正确识别到了四张人脸，但是同样将一个没有带口罩的人识别成了带有口罩的人。

; 平台测试：

后续通过调整各项参数并打乱测试集和训练集图片顺序来进行了多次实验，最终确定的最佳状态如下：

条件2：

取 `batch_size=64` , `lr=0.0001` ， `epochs=20` ，对训练之后的模型进行测试，得到结果如下：

图8 条件2 loss曲线

观察准确率曲线可以看出，在该条件下，验证集上的准确率最终稳定在98%附近，效果非常的好，说明我们做出的一些优化还是具有一定效果的。

图9 条件2 acc曲线

观察此条件下的 loss曲线可以看到最终验证集的 loss稳定在0.2左右，训练集的 loss非常小，基本趋近于0

图10 条件2 测试样例1

使用两张测试样例对模型进行检测，第一张图片所有检测点均正确，正确识别出了五张人脸并且口罩佩戴检测均正确，识别正确率100%。

图11 条件2 测试样例2

第二章测试样例上，正确识别出了4张人脸并且口罩佩戴检测结果均正确。

两张测试样例上所有检测点检测结果均正确，说明在此参数条件下，模型识别效果较好，达到了口罩佩戴检测的要求。

; 平台测试：

条件3：

使用更多测试样例发现 _MTCNN_人脸识别部分存在不能正确识别人脸的问题，故通过多次实验和测试，修改了 mask_rec()的门限函数权重 self.threshold，由原来的 self.threshold = [0.5,0.6,0.8] 修改为 self.threshold = [0.4,0.15,0.65]

在本地使用更多自选图片进行测试，发现人脸识别准确率有所提升。在条件2训练参数不变的情况下，使用同一模型进行平台测试，结果如下：

平台测试成绩有所提升。

; 条件4：

继续调整 mask_rec()的门限函数权重 self.threshold，通过系统测试反馈来决定门限函数的权重，通过多次测试，由原来的 self.threshold = [0.4,0.15,0.65] 修改为 self.threshold = [0.4,0.6,0.65]

平台测试，结果如下：

平台测试成绩有所提升，达到95分。

为了达到条件4所展示的效果，对门限函数的数值进行了大量的尝试，根据提交测试的反馈结果，最终确定数值为条件4时，可以达到最优。由于不知道后台测试图片是什么且没有反馈数据，所以最终再次修改人脸识别的门限函数或者修改参数重新训练口罩识别模型依旧没有提升。

五比较分析

验证集准确率测试样例结果平台成绩
条件1

96%7/977.5
条件2

98%9/988.33333334
条件3

98%9/990
条件4

98%9/995

最终通过不断调试与优化算法，得到了95分的平台成绩。

六心得与感想

本次实验过程中主要使用了 keras_方法进行训练，由于初次使用这些方法，所以前期实现的过程相对困难。最初我想通过调用 GPU资源来进行训练，所以给自己的电脑配套安装了 tensorflow-gpu、CUDA等等配套的软件和包，由于个人电脑的显卡版本较老，所以安装的过程也是非常的曲折。好在最终安装好了所有的东西，但是由于显卡显存比较小，所以 bath_size大小一直上不去，最大只能给到32，不过影响也不大。调整参数的过程花费了很多的时间，优化算法也花费了很多的时间。之后又对门限函数进行了修改，虽然过程非常的辛苦，但最终的结果还是很不错的，最终整体达到 95_分，在两张给定的测试样例上所有检测点都是正确的，由于不知道平台的五张检测照片是什么，所以不知道到底出错在哪里，希望之后平台可以反馈一些修改意见~。总的来说在过程中收获还是很大的，受益匪浅。

训练源代码：

import warnings

warnings.filterwarnings('ignore')
import os
import matplotlib
import cv2 as cv
import numpy as np
import matplotlib.pyplot as plt
from tensorflow.keras.callbacks import ModelCheckpoint, ReduceLROnPlateau, EarlyStopping
from tensorflow.keras.applications.imagenet_utils import preprocess_input
from tensorflow.keras import backend as K
from tensorflow.keras.optimizers import Adam
K.image_data_format() == 'channels_last'
from keras_py.utils import get_random_data
from keras_py.face_rec import mask_rec
from keras_py.face_rec import face_rec
from keras_py.mobileNet import MobileNet
from tensorflow.keras.preprocessing.image import ImageDataGenerator

basic_path = "./datasets/5f680a696ec9b83bb0037081-momodel/data/"

def letterbox_image(image, size):
    new_image = cv.resize(image, size, interpolation=cv.INTER_AREA)
    return new_image
read_img = cv.imread("test1.jpg")
print("调整前图片的尺寸:", read_img.shape)
read_img = letterbox_image(image=read_img, size=(50, 50))
print("调整前图片的尺寸:", read_img.shape)

def processing_data(data_path, height, width, batch_size=32, test_split=0.1):

    train_data = ImageDataGenerator(

            rescale=1. / 255,

            shear_range=0.1,

            zoom_range=0.1,

            width_shift_range=0.1,

            height_shift_range=0.1,

            horizontal_flip=True,

            vertical_flip=True,

            validation_split=test_split
    )

    test_data = ImageDataGenerator(
            rescale=1. / 255,
            validation_split=test_split)

    train_generator = train_data.flow_from_directory(

            data_path,

            target_size=(height, width),

            batch_size=batch_size,

            class_mode='categorical',

            subset='training',
            seed=0)
    test_generator = test_data.flow_from_directory(
            data_path,
            target_size=(height, width),
            batch_size=batch_size,
            class_mode='categorical',
            subset='validation',
            seed=0)

    return train_generator, test_generator

data_path = basic_path + 'image'

height, width = 160, 160

train_generator, test_generator = processing_data(data_path, height, width)

labels = train_generator.class_indices
print(labels)

labels = dict((v, k) for k, v in labels.items())
print(labels)
pnet_path = "./datasets/5f680a696ec9b83bb0037081-momodel/data/keras_model_data/pnet.h5"
rnet_path = "./datasets/5f680a696ec9b83bb0037081-momodel/data/keras_model_data/rnet.h5"
onet_path = "./datasets/5f680a696ec9b83bb0037081-momodel/data/keras_model_data/onet.h5"

weights_path = basic_path + 'keras_model_data/mobilenet_1_0_224_tf_no_top.h5'

height, width = 160, 160
model = MobileNet(input_shape=[height,width,3],classes=2)
model.load_weights(weights_path,by_name=True)
print('加载完成...')
def save_model(model, checkpoint_save_path, model_dir):

    if os.path.exists(checkpoint_save_path):
        print("模型加载中")
        model.load_weights(checkpoint_save_path)
        print("模型加载完毕")
    checkpoint_period = ModelCheckpoint(

        model_dir + 'ep{epoch:03d}-loss{loss:.3f}-val_loss{val_loss:.3f}.h5',

        monitor='val_acc',

        mode='max',

        save_weights_only=False,

        save_best_only=True,

        period=2
    )
    return checkpoint_period
checkpoint_save_path = "./results/last_one88.h5"
model_dir = "./results/"
checkpoint_period = save_model(model, checkpoint_save_path, model_dir)

reduce_lr = ReduceLROnPlateau(
                        monitor='accuracy',
                        factor=0.5,
                        patience=3,
                        verbose=2
                    )
early_stopping = EarlyStopping(
                            monitor='val_accuracy',
                            min_delta=0.0001,
                            patience=3,
                            verbose=1
                        )

batch_size = 64

data_path = basic_path + 'image'

train_generator, test_generator = processing_data(data_path, height=160, width=160, batch_size=batch_size, test_split=0.1)

model.compile(loss='binary_crossentropy',
              optimizer=Adam(lr=0.001),
              metrics=['accuracy'])

history = model.fit(train_generator,
                    epochs=20,

                    steps_per_epoch=637 // batch_size,
                    validation_data=test_generator,
                    validation_steps=70 // batch_size,
                    initial_epoch=0,
                    callbacks=[checkpoint_period, reduce_lr])

model.save_weights(model_dir + 'temp.h5')
plt.plot(history.history['loss'],label = 'train_loss')
plt.plot(history.history['val_loss'],'r',label = 'val_loss')
plt.legend()
plt.show()

plt.plot(history.history['accuracy'],label = 'acc')
plt.plot(history.history['val_accuracy'],'r',label = 'val_acc')
plt.legend()
plt.show()

设计报告和源码下载地址：https://download.csdn.net/download/sheziqiong/85594224

Original: https://blog.csdn.net/newlw/article/details/124897861
Author: biyezuopinvip
Title: 基于Python实现的口罩佩戴检测

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/624484/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【强化学习探索01】Win10 下gym安装

一、序言⾸先， gym 是 OpenAI 开发的通⽤强化学习算法测试平台，背后有⼤神 Pieter Abbeel、 Sergey Levine 等⼈率领的强⼤团队的⽀持。其次，…

人工智能 2023年5月23日
00123
大数据挖掘企业服务平台-道路运输安全大数据分析解决方案

1 方案背景当前运输市场竞争激烈，道路运输企业受传统经营观念影响，企业管理者安全意识淡薄，从业人员规范化、流程化的管理水平较低，导致制度规范在落实过程中未能有效监督与管理，执行过…

人工智能 2023年7月17日
0045
TensorFlow2 入门指南 | 19 模型文件的保存与加载

前言：本专栏在保证内容完整性的基础上，力求简洁，旨在让初学者能够更快地、高效地入门TensorFlow2 深度学习框架。如果觉得本专栏对您有帮助的话，可以给一个小小的三连，各位的…

人工智能 2023年5月25日
0069
企业关联图谱源码提供

企业关联图谱（Enterprise Profile）提供企业多维度信息查询，资深挖掘企业之间、企业与个人关系链路。通过数据可视化、分析、检索赋能各行业应用。企业关联图谱主要构建企…

人工智能 2023年6月4日
0073
python数据分析及可视化（十二）Seaborn可视化（绘图风格、颜色风格、线性关系可视化、分类数据可视化、数据集分布可视化、关系矩阵图）

Seaborn可视化 Seaborn 是一个基于 matplotlib 且数据结构与 pandas 统一的统计图制作库，很多使用跟matplotlib的使用方法相同，颜色配置等，之…

人工智能 2023年6月30日
0096
ORB-SLAM2 三种跟踪模式总结（参考关键帧跟踪、恒速模型跟踪、重定位跟踪）

总体概要在系统初始化成功后，mState状态会置位，下一帧来临后，首先检查上一帧的地图点是否需要进行替换，如果需要替换则替换。由于刚初始化完成，所以相机是没有速度的，所以首先使用…

人工智能 2023年6月11日
0084
Google Earth Engine 教程——利用sentinel-2数据对农田进行逐月边缘监测分析

本章提供了Watkins和van Niekerk[3]的部分实施方案，以划定南非Vaalharts灌溉计划的农田边界。函数： ee.Algorithms.CannyEdgeDet…

人工智能 2023年6月29日
0080
【人工智能】Fisher 线性分类器的设计与实现（QDU）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

人工智能 2023年7月28日
0056
python | Pandas库导入Excel数据（xlsx格式文件）函数：read_excel()

导入csv格式文件 python | Pandas库导入csv格式文件函数：read_excel()https://mp.csdn.net/mp_blog/creation/edi…

人工智能 2023年7月14日
0050
图像分类之机器学习基础厕所级讲解

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月14日
0056
简单记录阿里云语音识别API调用方法

Author：qyan.liDate：2022.5.15Topic：简单记录阿里云语音识别 API调用 ~~~~~~最近的课程设计需要 语&#x9…

人工智能 2023年5月25日
0060
使用 OpenCV 收集数据

OpenCV 是”开源计算机视觉”的缩写，是一个机器学习库，旨在实现图像处理和计算机视觉应用。与对象检测和识别相反，OpenCV 还有一个应用是它收集数据的…

人工智能 2023年5月26日
0076
序列数据缺失值插补（线性插值）

（时间）序列数据处理过程中往往会有缺失值（例如9999、NaN或其他的异常值），对这些数据的处理是下一步分析、研究和应用的基础。本文以 2018年 MOD09A01 地表反射率数…

人工智能 2023年7月15日
0062
用TensorFlow实现线性回归（包括过程中出现的问题及解决方法）

用TensorFlow实现线性回归实验 * – 实验目的： – 实验内容 – + 一．TensorFlow环境安装 + 二．利用TensorFl…

人工智能 2023年5月23日
0079
文本向量化的方法

文本向量化 one-hot 编码 word embedding word embedding API 由于文本不能直接输入到模型中进行相关计算，因此首先需要将文本转换为向量的形式。…

人工智能 2023年5月27日
0092
2022MySQL 8.0.30 安装及配置（详细教程）

### 回答1：好的，以下是 mysql– 8.0. 30_的 _安装_和 _配置教程：步骤1：下载 MySQL 从官方网站 https://dev. mysql…

人工智能 2023年7月29日
0069

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

基于Python实现的口罩佩戴检测

一 题目背景

1.1 实验介绍

1.2 实验要求

1.3 实验环境

1.4 实验思路

; 二 实验内容

2.1 已知文件与数据集

2.2 图片尺寸调整

2.3 制作训练时需要用到的批量数据集

2.4 调用MTCNN

2.5 加载预训练模型MobileNet

2.6 训练模型

2.6.1 加载和保存

2.6.2 手动调整学习率

2.6.3 早停法

2.6.4 乱序训练数据

2.6.5 训练模型

三 算法描述

3.1 MTCNN

; 3.2 MobileNet

四 求解结果

条件1：

取 batch_size=48 , lr=0.001 ， epochs=20 ，对训练之后的模型进行测试，得到结果如下：

; 平台测试：

条件2：

取 batch_size=64 , lr=0.0001 ， epochs=20 ，对训练之后的模型进行测试，得到结果如下：

; 平台测试：

条件3：

; 条件4：

五 比较分析

六 心得与感想

大家都在看

一题目背景

; 二实验内容

三算法描述

四求解结果

取 `batch_size=48` , `lr=0.001` ， `epochs=20` ，对训练之后的模型进行测试，得到结果如下：

取 `batch_size=64` , `lr=0.0001` ， `epochs=20` ，对训练之后的模型进行测试，得到结果如下：

五比较分析

六心得与感想