MobileNets(V1)的Tensorflow实现

2023年5月26日下午4:49 • 人工智能 • 阅读 81

前言

在前一篇中MobileNets(V1)简介及两个初步的代码实验介绍基于Tensorflow.keras的预训练模型的实验，本篇更进一步，直接搭建一个MobileNetV1网络模型并在Cifar10数据集上从零开始训练。MobileNetV1网络模型的代码参考自另一篇CSDN博客（Ref2）。

模型搭建

import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers
from tensorflow.keras import utils
import numpy as np
import matplotlib.pyplot as plt
from PIL import Image
print(tf.__version__)

def conv_block(inputs,filters,kernel_size=(3, 3),strides=(1, 1)):
    x = tf.keras.layers.Conv2D(filters, kernel_size=kernel_size, strides=strides, padding='same', use_bias=False)(
        inputs)
    tf.keras.layers.BatchNormalization()(x)
    return tf.keras.layers.ReLU(6.0)(x)

def depthwise_conv_block(inputs,pointwise_conv_filters,strides=(1, 1)):
    x = tf.keras.layers.DepthwiseConv2D((3, 3), padding='same', strides=strides, use_bias=False)(inputs)
    x = tf.keras.layers.BatchNormalization()(x)
    x = tf.keras.layers.ReLU(6.0)(x)

    x = tf.keras.layers.Conv2D(pointwise_conv_filters, kernel_size=(1, 1), padding='same', use_bias=False)(x)
    x = tf.keras.layers.BatchNormalization()(x)

    return tf.keras.layers.ReLU(6.0)(x)

def mobilenet_v1(inputs,classes):
    x = conv_block(inputs, 32, strides=(2, 2))
    x = depthwise_conv_block(x, 64)
    x = depthwise_conv_block(x, 128, strides=(2, 2))
    x = depthwise_conv_block(x, 128)
    x = depthwise_conv_block(x, 256, strides=(2, 2))
    x = depthwise_conv_block(x, 256)
    x = depthwise_conv_block(x, 512, strides=(2, 2))
    x = depthwise_conv_block(x, 512)
    x = depthwise_conv_block(x, 512)
    x = depthwise_conv_block(x, 512)
    x = depthwise_conv_block(x, 512)
    x = depthwise_conv_block(x, 512)
    x = depthwise_conv_block(x, 1024, strides=(2, 2))
    x = depthwise_conv_block(x, 1024)
    x = tf.keras.layers.GlobalAveragePooling2D()(x)
    x = tf.keras.layers.Dense(classes, activation='softmax')(x)
    return x

INPUT_WIDTH = 32
INPUT_HEIGHT = 32
N_CHANNELS = 3
N_CLASSES = 10
inputs = tf.keras.Input(shape=(INPUT_WIDTH, INPUT_HEIGHT, N_CHANNELS))
model = tf.keras.Model(inputs=inputs, outputs=mobilenet_v1(inputs, N_CLASSES))
model.summary()

相比常规的卷积神经网络，就是多出来tf.keras.layers.DepthwiseConv2D的调用。当然，更进一步的话，也可以纯粹地基于python/numpy来实现自己的DepthwiseConv2D。

总参数个数与上一篇中基于预训练模型的结构的参数个数略有出入(少了64个参数，why?)，待确认。

数据准备

基于tensorflow.keras内置数据集cifar10进行实验。

(x_train, y_train), (x_test, y_test) = tf.keras.datasets.cifar10.load_data()
x_train = x_train / 255.0
y_train = tf.keras.utils.to_categorical(y_train, N_CLASSES)
x_test  = x_test / 255.0
y_test  = tf.keras.utils.to_categorical(y_test, N_CLASSES)

模型训练

from tensorflow.keras import optimizers
model.compile(loss="categorical_crossentropy",
    #optimizer=optimizers.RMSprop(learning_rate=2e-5),
    optimizer='RMSprop',
    #metrics=['categorical_accuracy', 'Recall', 'AUC'])
    metrics=['accuracy', 'Recall', 'AUC'])

callbacks = [
    keras.callbacks.ModelCheckpoint(
      filepath="mobilenet_v1_cifar10.h5",
      save_best_only=True,
      monitor="val_loss")
]
history = model.fit(
    x_train, y_train,
    batch_size=32,
    epochs=20,
    validation_data=(x_test, y_test),
    callbacks=callbacks)

结果分析

import matplotlib.pyplot as plt
accuracy = history.history["accuracy"]
val_accuracy = history.history["val_accuracy"]
loss = history.history["loss"]
val_loss = history.history["val_loss"]
epochs = range(1, len(accuracy) + 1)
fig,ax = plt.subplots(1,2,figsize=(12,6)) # figsize=(width, height)
ax[0].plot(epochs, accuracy, "bo", label="Training accuracy")
ax[0].plot(epochs, val_accuracy, "b", label="Validation accuracy")
ax[0].set_title("Training and validation accuracy")
ax[0].legend()
ax[1].plot(epochs, loss, "bo", label="Training loss")
ax[1].plot(epochs, val_loss, "b", label="Validation loss")
ax[1].set_title("Training and validation loss")
ax[1].legend()

20个epoch的训练结果如下所示。

只看训练集的结果的话，再增加epoches次数应该还能进一步提高。但是看验证集上的结果的话，大概从第13轮开始就到顶进入平层了，也就是说存在比较严重的overfitting。

用基于内置MobileNetV1结构进行基于Cifar10的相同参数的训练后得到的结果如下：

可以看到accuracy时基本一致的，但是validation loss曲线有一些差异，原因待查。

Ref1：MobileNets(V1)简介及两个初步的代码实验

Ref2: 【TensorFlow2.0实战】基于TnesorFlow实现MobileNet V1

Original: https://blog.csdn.net/chenxy_bwave/article/details/124514403
Author: 笨牛慢耕
Title: MobileNets(V1)的Tensorflow实现

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/520618/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

数据分析代码

1，打开： data=pd.read_csv(‘data_etr.csv’,parse_dates=[‘DATA_DATE’],en…

人工智能 2023年7月8日
0074
2021电赛F题视觉教程+代码免费开源

2021电赛F题视觉教程+代码免费开源最近好多要电赛题的源码，其他csdn营销号下载都需要会员或钱，正好最近课设又要做一遍电赛小车题，哥们先把代码开源了，饿死营销号电赛宝藏链接…

人工智能 2023年6月26日
0060
【AI论文精粹】学习解释图像分类器；脑信号的应用；多模态神经脚本知识模型；可微点过程

标题：Bounded logit attention：学习解释图像分类器时间：2021.5.31 作者：Thomas Baumhauer, Djordje Slijepcevic…

人工智能 2023年5月25日
0071
CentOS最小安装如何联网

Cent OS最小安装在默认状态下使用 NetworkManager这个服务来控制联网，但是这个配置在配置生产环境服务器时一般不会使用，而是使用系统自带的 network服务，更加…

人工智能 2023年6月4日
0089
2022爱分析･时尚品牌数字化实践报告

报告编委特别鸣谢（按拼音排序）报告摘要商品、营销两端发力，时尚品牌数字化正当时经济发展、科技进步，再叠加上疫情因素，对包括鞋服、饰品、美妆在内的整个时尚行业及消费者消费方式…

人工智能 2023年6月11日
0086
【Python】pandas的使用——CSV文件、Excel文件、TXT文件之间的转换

实验：pandas的使用——CSV文件、Excel文件、TXT文件之间的转换文章目录实验：pandas的使用——CSV文件、Excel文件、TXT文件之间的转换 * 实验目的：…

人工智能 2023年7月7日
0073
2021年蓝桥杯赛题【Python】

【填空】 1、卡片小蓝有很多数字卡片，每张卡片上都是数字 0 到 9。小蓝准备用这些卡片来拼一些数，他想从 1 开始拼出正整数，每拼一个，就保存起来，卡片就不能用来拼其它数了…

人工智能 2023年7月5日
00121
神经网络激活函数与求导

文章目录 * – + 神经网络激活函数求导 + * 1、Sigmoid 激活函数 * 2、Tanh 激活函数 * 3、Softmax 激活函数神经网络激活函数求导 1…

人工智能 2023年7月14日
0073
VS2019 MFC配置OpenCV430

一、环境变量配置下载OpenCV，解压结束后，鼠标右键此电脑，打开属性，打开高级系统设置，选择环境变量，找到系统变量中的path变量，双击，点击新建，将解压后opencv文件夹中…

人工智能 2023年7月20日
0063
MATLAB安装随机森林分类安装包

MATLAB安装随机森林分类安装包安装步骤此文章部分参考https://blog.csdn.net/weixin_42929622/article/details/115336…

人工智能 2023年7月1日
0063
【OpenCV 例程300篇】12. 图像通道的合并（cv2.merge）

文章目录：『youcans 的 OpenCV 例程200篇 – 总目录』【OpenCV 例程300篇】12. 图像通道的合并（cv2.merge）函数 cv2.me…

人工智能 2023年6月18日
0086
论文解读：DETR 《End-to-end object detection with transformers》，ECCV 2020

论文解读：DETR 《End-to-end object detection with transformers》，ECCV 2020 * – 0. 论文基本信息 &#…

人工智能 2023年7月12日
0098
机器学习之进化算法

学习目标：遗传算法基础基因重组与基因突变遗传算法实现技术遗传算法实例一、遗传算法进化计算（Evolutionary Computation）包括遗传算法（Genetic…

人工智能 2023年7月28日
0060
如何使用Tensor进行索引和切片操作

问题：如何使用Tensor进行索引和切片操作？详细介绍张量（Tensor）是一个多维数组，可以看作是一个矩阵或向量的泛化。在深度学习中，Tensor是最基本的数据结构，广泛用于…

人工智能 2024年1月1日
0047
基于51单片机的时钟闹钟温度计LCD1602显示proteus仿真原理图PCB

功能介绍：0.本系统采用STC89C52作为单片机1.LCD1602液晶实时显示时间/当前温度2.按键可进行闹钟设置和温度上下限设置3.到达闹钟时间或温度超过阈值范围，蜂鸣器报警4…

人工智能 2023年6月29日
0071
通过公式和源码解析 DETR 中的损失函数 & 匈牙利算法（二分图匹配）

上一篇文章：DETR 论文精读，并解析模型结构_Flying Bulldog的博客-CSDN博客可以先了解概念，然后再分析源码。匈牙利算法目的：完成最优分配，假设有六位老师和六种…

人工智能 2023年7月27日
0094

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

MobileNets(V1)的Tensorflow实现

大家都在看