Tensorflow训练数字识别数据集并部署在OpenCV上

2023年5月24日下午6:35 • 人工智能 • 阅读 52

leNet训练自制数据集并部署在OpenCV上
–0. 简介
–1. 数据集介绍
–2. 数据集读取
–3. 网络搭建
–4. 模型配置与部分超参数设置
–5. 训练结果
–6. 模型转换与部署
–7. 模型训练源码

在leNet的基础上修改网络部分超参数，训练自制数据集并保存模型为pb文件，最后部署在OpenCV的dnn模块上用于目标分类。

这是大疆举办的RoboMaster比赛中视觉组所要识别的一些装甲板。其中带数字的装甲板是比赛中要识别主要的目标，对应的标签为其数字；而一些比赛中可能误识别的目标，需要进行排除，其标签均设为0。故总共6类标签。

我随机挑选了1463张图片作为训练集，559张图片作为测试集。将训练好的模型保存

def makeDataset(path):
    dataset_path = path
    Images_Path = os.listdir(dataset_path)
    Labels = []
    Data = []
    for image_name in Images_Path:
        image_path = dataset_path + '/' + image_name
        image = cv2.imread(image_path)
        image = cv2.resize(image, (32, 32))

        Data.append(image)

        if image_name.find('hero') != -1:
            Labels.append(1)
        elif image_name.find('engineer') != -1:
            Labels.append(2)
        elif image_name.find('infantry3') != -1:
            Labels.append(3)
        elif image_name.find('infantry4') != -1:
            Labels.append(4)
        elif image_name.find('infantry5') != -1:
            Labels.append(5)
        else:
            Labels.append(0)
    Data = np.array(Data)
    Data = Data / 255.0
    Labels = np.array(Labels)

    return Data, Labels

module = tf.keras.Sequential([
    Input(shape=(32,32,3), dtype=tf.float32, name='Input'),
    Conv2D(filters=5, kernel_size=(5,5), padding='valid'),
    Activation('sigmoid'),
    MaxPooling2D(pool_size=(2,2), strides=2, padding='valid'),
    Conv2D(filters=16, kernel_size=(5,5), padding='valid'),
    Activation('sigmoid'),
    MaxPooling2D(pool_size=(2,2), strides=2, padding='valid'),
    Flatten(),
    Dense(120, activation='sigmoid'),
    Dense(84, activation='sigmoid'),
    Dense(6, activation='softmax', name='Output')
])

这里相较于原leNet，对第一层卷积层作出了一些修改，将卷积核数改为5个，输入图的通道改为3通道，同时也对最后一层全连接层的输出数修改为6以对应6种标签

module.compile(optimizer='adam',
               loss=SparseCategoricalCrossentropy(from_logits=False),
               metrics=['sparse_categorical_accuracy'])
history = module.fit(train_Data, train_Labels, batch_size=32, epochs=30,
                        validation_data=(test_Data, test_Labels),
                        validation_freq=1, callbacks=cp_callback)

在一开始的测试中发现训练5轮的效果非常差，正确率不到0.3，但差不多在10轮后，正确率开始陡增。训练100轮的正确率结果几乎为1，loss值也非常小数量级为10^-5，有可能过拟合。故设置训练30轮。
使用了回调函数对模型的ckpt文件进行保存。

网络在训练集上的正确率非常接近1，但在测试集上的效果一般，正确率在0.9左右。

[En]

The correct rate of the network on the training set is very close to 1, but the effect on the test set is general, the correct rate is about 0.9.

通过tf.keras.models.save_model()得到的模型pb文件并不能直接用于OpenCV的dnn上，需要保存为frozen graph格式，因此需要对导出模型进行转换。出处: https://leimao.github.io/blog/Save-Load-Inference-From-TF2-Frozen-Graph/

import tensorflow as tf
from tensorflow import keras
from tensorflow.python.framework.convert_to_constants import convert_variables_to_constants_v2
import numpy as np

frozen_out_path = './Module'
frozen_graph_filename = 'frozen_graph'

model = tf.keras.models.load_model('./Module/leNet2')

full_model = tf.function(lambda x: model(x))
full_model = full_model.get_concrete_function(
    tf.TensorSpec(model.inputs[0].shape, model.inputs[0].dtype))

frozen_func = convert_variables_to_constants_v2(full_model)
frozen_func.graph.as_graph_def()

layers = [op.name for op in frozen_func.graph.get_operations()]
print("-" * 60)
print("Frozen model layers: ")
for layer in layers:
    print(layer)
print("-" * 60)
print("Frozen model inputs: ")
print(frozen_func.inputs)
print("Frozen model outputs: ")
print(frozen_func.outputs)

tf.io.write_graph(graph_or_graph_def=frozen_func.graph,
                  logdir=frozen_out_path,
                  name=f"{frozen_graph_filename}.pb",
                  as_text=False)
tf.io.write_graph(graph_or_graph_def=frozen_func.graph,
                  logdir=frozen_out_path,
                  name=f"{frozen_graph_filename}.pbtxt",
                  as_text=True)

最后通过c++上的OpenCV进行部署:

#include
#include

using namespace std;
using namespace cv;

int main()
{
    dnn::Net net = dnn::readNetFromTensorflow("/home/shanzoom/PycharmProjects/pythonProject/Module/frozen_graph.pb");
    Mat frame = imread("/home/shanzoom/Robot_DataSet_3.0(balanced)/test2/engineer_  (2906).jpg");
    imshow("frame",frame);
    frame = dnn::blobFromImage(frame, 1.0/255.0, Size(32,32));

    net.setInput(frame);

    Mat score = net.forward();
    Point maxclass;
    minMaxLoc(score, NULL, NULL, NULL, &maxclass);
    cout << "装甲板数字： " << maxclass.x << endl;

    waitKey(0);
}

import tensorflow as tf
from tensorflow.keras.layers import *
from tensorflow.keras.losses import *
import matplotlib.pyplot as plt
import cv2
import numpy as np
import os

def makeDataset(path):
    dataset_path = path
    Images_Path = os.listdir(dataset_path)
    Labels = []
    Data = []
    for image_name in Images_Path:
        image_path = dataset_path + '/' + image_name
        image = cv2.imread(image_path)
        image = cv2.resize(image, (32, 32))

        Data.append(image)

        if image_name.find('hero') != -1:
            Labels.append(1)
        elif image_name.find('engineer') != -1:
            Labels.append(2)
        elif image_name.find('infantry3') != -1:
            Labels.append(3)
        elif image_name.find('infantry4') != -1:
            Labels.append(4)
        elif image_name.find('infantry5') != -1:
            Labels.append(5)
        else:
            Labels.append(0)

    Data = np.array(Data)
    Data = Data / 255.0
    Labels = np.array(Labels)

    return Data, Labels

train_path = '/home/shanzoom/Robot_DataSet_3.0(balanced)/svm_train'
train_Data, train_Labels = makeDataset(train_path)

test_path = '/home/shanzoom/Robot_DataSet_3.0(balanced)/svm_test'
test_Data, test_Labels = makeDataset(test_path)

module = tf.keras.Sequential([
    Input(shape=(32,32,3), dtype=tf.float32, name='Input'),
    Conv2D(filters=5, kernel_size=(5,5), padding='valid'),
    Activation('sigmoid'),
    MaxPooling2D(pool_size=(2,2), strides=2, padding='valid'),
    Conv2D(filters=16, kernel_size=(5,5), padding='valid'),
    Activation('sigmoid'),
    MaxPooling2D(pool_size=(2,2), strides=2, padding='valid'),
    Flatten(),
    Dense(120, activation='sigmoid'),
    Dense(84, activation='sigmoid'),
    Dense(6, activation='softmax', name='Output')
])

module.compile(optimizer='adam',
               loss=SparseCategoricalCrossentropy(from_logits=False),
               metrics=['sparse_categorical_accuracy'])

ckpt_path = './checkpoint/leNet.ckpt'
if os.path.exists(ckpt_path + '.index'):
    print('----load----')
    module.load_weights(ckpt_path)

cp_callback = tf.keras.callbacks.ModelCheckpoint(filepath=ckpt_path,
                                                 save_weights_only=True,
                                                 save_best_only=True)

history = module.fit(train_Data, train_Labels, batch_size=32, epochs=30, validation_data=(test_Data, test_Labels),
                     validation_freq=1, callbacks=cp_callback)
module.summary()

tf.keras.models.save_model(module,'./Module/leNet2')

acc = history.history['sparse_categorical_accuracy']
val_acc = history.history['val_sparse_categorical_accuracy']
loss = history.history['loss']
val_loss = history.history['val_loss']
plt.subplot(1, 2, 1)
plt.plot(acc, label='Training Accuracy')
plt.plot(val_acc, label='Validation Accuracy')
plt.title('Training and Validation Accuracy')
plt.legend()
plt.subplot(1, 2, 2)
plt.plot(loss, label='Training Loss')
plt.plot(val_loss, label='Validation Loss')
plt.title('Training and Validation Loss')
plt.show()

Original: https://blog.csdn.net/qq_52967097/article/details/123708406
Author: 啊！山鬃
Title: Tensorflow训练数字识别数据集并部署在OpenCV上

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/508847/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

DataFrame基本操作

其实代码就是按照人的思维编写的底层，所有的函数都是按照人类的认知定义的。 1、读取表，设置类索引和行索引 2、格式化函数 .format() 3、日期的转化函数（import ti…

人工智能 2023年7月7日
0070
【详解】BiLSTM+CRF模型

目录 * – + * 1 BiLSTM-CRF模型用途 * 2 BiLSTM-CRF模型介绍 * – 2.1 数据标签及模型架构 – + 2.1…

人工智能 2023年6月24日
0093
【自然语言处理】hmm隐马尔可夫模型进行中文分词代码

本文摘要 · 理论来源：【统计自然语言处理】第七章自动分词；【统计学习方法】第十章隐马尔可夫模型· 代码目的：手写HMM进行中文分词作者：CSDN 征途黯然. 一、数据集数据…

人工智能 2023年5月30日
0085
matlab改变图片亮度（HSV模型）

目录 1 解决思路 * 1.1 问题背景 1.2 解决思路 2 采用”渐变”的方式改变调整的”力度” * 2.1 线性调整 2.2 …

人工智能 2023年6月18日
00322
PyTorch中的优化器有哪些？何时应该使用哪个优化器

问题：PyTorch中的优化器有哪些？何时应该使用哪个优化器？优化器是深度学习中非常重要的组件，它用于调整模型的参数以最小化损失函数。PyTorch提供了多种优化器，包括随机梯度…

人工智能 2024年1月2日
0031
Unified Named Entity Recognition as Word-Word Relation Classification

论文链接：Unified Named Entity Recognition as Word-Word Relation Classification code链接： https:/…

人工智能 2023年5月27日
0084
李航《统计学习方法》笔记之监督学习Supervised learning

监督学习Supervised learning 1.1 监督学习(supervised learning）指从标注数据中学习预测模型的机器学习问题。标注数据表示输入输出的对应关系…

人工智能 2023年6月25日
0065
梯度下降与反向传播算法的原理与推导

梯度下降算法是机器学习中最常用的优化算法之一，它可以求得目标函数的最小值，即算法的最优解。而对于复杂的多层神经网络来说，运用梯度下降算法十分复杂，因为其包含求导过程，为此学者将多层…

人工智能 2023年7月13日
0055
优化GPU显存不足，提高GPU利用率

1 常用GPU显存不足时的各种Trick 1）监控GPU 2）估计模型显存 3）显存不足时的Trick 4）提高GPU内存利用率 2 数据处理及算法角度提高利用率 1 常用GPU显…

人工智能 2023年5月28日
0064
R语言dplyr包distinct函数基于dataframe数据中的所有变量移除重复行

R语言dplyr包distinct函数基于dataframe数据中的所有变量移除重复行 Original: https://blog.csdn.net/weixin_5724200…

人工智能 2023年6月26日
0077
如何用Python对股票数据进行LSTM神经网络和XGboost机器学习预测分析（附源码和详细步骤），学会的小伙伴们说不定就成为炒股专家一夜暴富了

前言最近调研了一下我做的项目受欢迎程度，大数据分析方向竟然排第一，尤其是这两年受疫情影响，大家都非常担心自家公司裁员或倒闭，都想着有没有其他副业搞搞或者炒炒股、投资点理财产品，未…

人工智能 2023年7月26日
0070
遥感小目标检测论文梳理

多模态密度图方法结合强化学习密度图方法 Perceptual Generative Adversarial Networks for Small Object Detecti…

人工智能 2023年7月9日
0054
ConvNeXt：A ConvNet for the 2020s

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月25日
0066
【机器学习】具有神经网络思维的Logistic回归

练习1-具有神经网络思维的Logistic回归介绍在本练习中，我们将搭建一个简单的神经网络（逻辑回归）并用于”识别猫”。在开始练习前，需要下载如下的…

人工智能 2023年6月17日
00117
语法转换_转换生成语法

点击蓝字关注我们免责声明：本文摘自网络，如有任何侵犯您利益的行为，请联系后台删除，本文仅供考研考生参考，绝不做与您兴趣相关的活动。 [En] Disclaimer: this a…

人工智能 2023年5月27日
0077
2021 SLAM会议论文汇总

目录 1.ICRA2021 * 语义定位与建图视觉SLAM 视觉里程计视觉三维重建视觉惯性里程计跟踪深度估计视觉定位激光雷达定位多传感器数据融合多传感器融合建图 …

人工智能 2023年6月2日
0086

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Tensorflow训练数字识别数据集并部署在OpenCV上

大家都在看