Tensorflow训练数字识别数据集并部署在OpenCV上

2023年7月14日下午1:42 • 人工智能 • 阅读 71

leNet训练自制数据集并部署在OpenCV上
–0. 简介
–1. 数据集介绍
–2. 数据集读取
–3. 网络搭建
–4. 模型配置与部分超参数设置
–5. 训练结果
–6. 模型转换与部署
–7. 模型训练源码

在leNet的基础上修改网络部分超参数，训练自制数据集并保存模型为pb文件，最后部署在OpenCV的dnn模块上用于目标分类。

这是大疆举办的RoboMaster比赛中视觉组所要识别的一些装甲板。其中带数字的装甲板是比赛中要识别主要的目标，对应的标签为其数字；而一些比赛中可能误识别的目标，需要进行排除，其标签均设为0。故总共6类标签。

我随机挑选了1463张图片作为训练集，559张图片作为测试集。将训练好的模型保存

def makeDataset(path):
    dataset_path = path
    Images_Path = os.listdir(dataset_path)
    Labels = []
    Data = []
    for image_name in Images_Path:
        image_path = dataset_path + '/' + image_name
        image = cv2.imread(image_path)
        image = cv2.resize(image, (32, 32))

        Data.append(image)

        if image_name.find('hero') != -1:
            Labels.append(1)
        elif image_name.find('engineer') != -1:
            Labels.append(2)
        elif image_name.find('infantry3') != -1:
            Labels.append(3)
        elif image_name.find('infantry4') != -1:
            Labels.append(4)
        elif image_name.find('infantry5') != -1:
            Labels.append(5)
        else:
            Labels.append(0)
    Data = np.array(Data)
    Data = Data / 255.0
    Labels = np.array(Labels)

    return Data, Labels

module = tf.keras.Sequential([
    Input(shape=(32,32,3), dtype=tf.float32, name='Input'),
    Conv2D(filters=5, kernel_size=(5,5), padding='valid'),
    Activation('sigmoid'),
    MaxPooling2D(pool_size=(2,2), strides=2, padding='valid'),
    Conv2D(filters=16, kernel_size=(5,5), padding='valid'),
    Activation('sigmoid'),
    MaxPooling2D(pool_size=(2,2), strides=2, padding='valid'),
    Flatten(),
    Dense(120, activation='sigmoid'),
    Dense(84, activation='sigmoid'),
    Dense(6, activation='softmax', name='Output')
])

这里相较于原leNet，对第一层卷积层作出了一些修改，将卷积核数改为5个，输入图的通道改为3通道，同时也对最后一层全连接层的输出数修改为6以对应6种标签

module.compile(optimizer='adam',
               loss=SparseCategoricalCrossentropy(from_logits=False),
               metrics=['sparse_categorical_accuracy'])
history = module.fit(train_Data, train_Labels, batch_size=32, epochs=30,
                        validation_data=(test_Data, test_Labels),
                        validation_freq=1, callbacks=cp_callback)

在一开始的测试中发现训练5轮的效果非常差，正确率不到0.3，但差不多在10轮后，正确率开始陡增。训练100轮的正确率结果几乎为1，loss值也非常小数量级为10^-5，有可能过拟合。故设置训练30轮。
使用了回调函数对模型的ckpt文件进行保存。

网络在训练集上的正确率结果非常接近于1，但是在测试集上的效果一般，正确率约为0.9

通过tf.keras.models.save_model()得到的模型pb文件并不能直接用于OpenCV的dnn上，需要保存为frozen graph格式，因此需要对导出模型进行转换。出处: https://leimao.github.io/blog/Save-Load-Inference-From-TF2-Frozen-Graph/

import tensorflow as tf
from tensorflow import keras
from tensorflow.python.framework.convert_to_constants import convert_variables_to_constants_v2
import numpy as np

frozen_out_path = './Module'
frozen_graph_filename = 'frozen_graph'

model = tf.keras.models.load_model('./Module/leNet2')

full_model = tf.function(lambda x: model(x))
full_model = full_model.get_concrete_function(
    tf.TensorSpec(model.inputs[0].shape, model.inputs[0].dtype))

frozen_func = convert_variables_to_constants_v2(full_model)
frozen_func.graph.as_graph_def()

layers = [op.name for op in frozen_func.graph.get_operations()]
print("-" * 60)
print("Frozen model layers: ")
for layer in layers:
    print(layer)
print("-" * 60)
print("Frozen model inputs: ")
print(frozen_func.inputs)
print("Frozen model outputs: ")
print(frozen_func.outputs)

tf.io.write_graph(graph_or_graph_def=frozen_func.graph,
                  logdir=frozen_out_path,
                  name=f"{frozen_graph_filename}.pb",
                  as_text=False)
tf.io.write_graph(graph_or_graph_def=frozen_func.graph,
                  logdir=frozen_out_path,
                  name=f"{frozen_graph_filename}.pbtxt",
                  as_text=True)

最后通过c++上的OpenCV进行部署:

#include
#include

using namespace std;
using namespace cv;

int main()
{
    dnn::Net net = dnn::readNetFromTensorflow("/home/shanzoom/PycharmProjects/pythonProject/Module/frozen_graph.pb");
    Mat frame = imread("/home/shanzoom/Robot_DataSet_3.0(balanced)/test2/engineer_  (2906).jpg");
    imshow("frame",frame);
    frame = dnn::blobFromImage(frame, 1.0/255.0, Size(32,32));

    net.setInput(frame);

    Mat score = net.forward();
    Point maxclass;
    minMaxLoc(score, NULL, NULL, NULL, &maxclass);
    cout << "装甲板数字： " << maxclass.x << endl;

    waitKey(0);
}

import tensorflow as tf
from tensorflow.keras.layers import *
from tensorflow.keras.losses import *
import matplotlib.pyplot as plt
import cv2
import numpy as np
import os

def makeDataset(path):
    dataset_path = path
    Images_Path = os.listdir(dataset_path)
    Labels = []
    Data = []
    for image_name in Images_Path:
        image_path = dataset_path + '/' + image_name
        image = cv2.imread(image_path)
        image = cv2.resize(image, (32, 32))

        Data.append(image)

        if image_name.find('hero') != -1:
            Labels.append(1)
        elif image_name.find('engineer') != -1:
            Labels.append(2)
        elif image_name.find('infantry3') != -1:
            Labels.append(3)
        elif image_name.find('infantry4') != -1:
            Labels.append(4)
        elif image_name.find('infantry5') != -1:
            Labels.append(5)
        else:
            Labels.append(0)

    Data = np.array(Data)
    Data = Data / 255.0
    Labels = np.array(Labels)

    return Data, Labels

train_path = '/home/shanzoom/Robot_DataSet_3.0(balanced)/svm_train'
train_Data, train_Labels = makeDataset(train_path)

test_path = '/home/shanzoom/Robot_DataSet_3.0(balanced)/svm_test'
test_Data, test_Labels = makeDataset(test_path)

module = tf.keras.Sequential([
    Input(shape=(32,32,3), dtype=tf.float32, name='Input'),
    Conv2D(filters=5, kernel_size=(5,5), padding='valid'),
    Activation('sigmoid'),
    MaxPooling2D(pool_size=(2,2), strides=2, padding='valid'),
    Conv2D(filters=16, kernel_size=(5,5), padding='valid'),
    Activation('sigmoid'),
    MaxPooling2D(pool_size=(2,2), strides=2, padding='valid'),
    Flatten(),
    Dense(120, activation='sigmoid'),
    Dense(84, activation='sigmoid'),
    Dense(6, activation='softmax', name='Output')
])

module.compile(optimizer='adam',
               loss=SparseCategoricalCrossentropy(from_logits=False),
               metrics=['sparse_categorical_accuracy'])

ckpt_path = './checkpoint/leNet.ckpt'
if os.path.exists(ckpt_path + '.index'):
    print('----load----')
    module.load_weights(ckpt_path)

cp_callback = tf.keras.callbacks.ModelCheckpoint(filepath=ckpt_path,
                                                 save_weights_only=True,
                                                 save_best_only=True)

history = module.fit(train_Data, train_Labels, batch_size=32, epochs=30, validation_data=(test_Data, test_Labels),
                     validation_freq=1, callbacks=cp_callback)
module.summary()

tf.keras.models.save_model(module,'./Module/leNet2')

acc = history.history['sparse_categorical_accuracy']
val_acc = history.history['val_sparse_categorical_accuracy']
loss = history.history['loss']
val_loss = history.history['val_loss']
plt.subplot(1, 2, 1)
plt.plot(acc, label='Training Accuracy')
plt.plot(val_acc, label='Validation Accuracy')
plt.title('Training and Validation Accuracy')
plt.legend()
plt.subplot(1, 2, 2)
plt.plot(loss, label='Training Loss')
plt.plot(val_loss, label='Validation Loss')
plt.title('Training and Validation Loss')
plt.show()

Original: https://blog.csdn.net/qq_52967097/article/details/123708406
Author: 啊！山鬃
Title: Tensorflow训练数字识别数据集并部署在OpenCV上

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/692165/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python 列表去重的5种方式

列表去重在python实际运用中，十分常见，也是最基础的重点知识。以下总结了5种常见的列表去重方法一、使用for循环实现列表去重此方法去重后，原顺序保持不变。 for&#x…

人工智能 2023年6月30日
00106
灵境（元宇宙）深度解读李正海

前言灵境（元宇宙）这个词很火，网上有很多种概念定义，可以百度到的本文不做赘述。笔者经过长时间的思考，有了一些初步的认识。下面从四个方面解读灵境（元宇宙），分别是①信息内容的变化②…

人工智能 2023年5月28日
0083
Matplotlib安装与配置

1. Matplotlib 简介 Matplotlib 是 Python 生态系统的一个重要组成部分，是用于可视化的绘图库，它提供了一整套和 matlab 相似的命令 API 和可…

人工智能 2023年7月5日
0070
数据分析之卡方检验

1、卡方检验定义卡方检验，是用途非常广的一种假设检验方法，它在分类资料统计推断中的应用，包括两个率或两个构成比比较的卡方检验；多个率或多个构成比比较的卡方检验以及分类资料的相关分…

人工智能 2023年6月19日
00177
CNN图片分类(Pytorch)

这篇文章主要讲述用 pytorch 完成简单 CNN 图片分类任务，如果想对 CNN 的理论知识进行了解，可以看我的这篇文章，深度学习(一)——CNN卷积神经网络。图片分类我们…

人工智能 2023年7月3日
0094
基于深度学习的人脸性别识别系统（含UI界面，Python代码）

摘要：人脸性别识别是人脸识别领域的一个热门方向，本文详细介绍基于深度学习的人脸性别识别系统，在介绍算法原理的同时，给出 P y t h o n_的实现代码以及 _P y Q _t_…

人工智能 2023年6月4日
00128
【自然语言处理】【聚类】基于对比学习的聚类算法SCCL

基于对比学习的聚类算法SCCL 相关博客：【自然语言处理】【聚类】基于神经网络的聚类算法DEC【自然语言处理】【聚类】基于对比学习的聚类算法SCCL【自然语言处理】【聚类】DCSC…

人工智能 2023年5月27日
0087
目标检测: 一文读懂 YOLOX

论文：YOLOX: Exceeding YOLO Series in 2021 论文链接：https://arxiv.org/pdf/2107.08430.pdf 代码链接：htt…

人工智能 2023年6月23日
0095
Pandas模块基础

文章目录知识点 * Pandas核心对象Series和DataFrame – Pandas模块介绍模块的安装 Pandas的数据结构介绍-Series + * 示例…

人工智能 2023年7月7日
0062
只有我一个人对ChatGPT感到蕉绿吗？

卷友们好，我是rumor。上周四，在国内公众号还没刷屏的时候，的消息了，当时迅速看了下博客内容，心想「就这？」，这不跟DeepMind的一样吗？而且设计的还没它好，Sparro…

人工智能 2023年7月31日
0059
【深度学习】生成模型：VAE(自编码器)模型解析

目录 1 前言 2 VAE模型 * 2.1 VAE模型推导 2.2 重参化技巧 3 QA * 3.1 生成体现在什么地方 3.2 AE和VAE的区别 4 另一种角度理解VAE 5 …

人工智能 2023年7月27日
00103
从离线分析建模到稳健风控升级，为什么说顶象Dinsight实时风控引擎是对的选择？

随着金融业数字化程度进一步加深，互联网垂直电商、消费金融等领域与人们生活的深度融合，数字科技在安全风险控制上已经成为了重要的基石。如何主动防范化解风险，建立智能化的实时风险监测预警…

人工智能 2023年6月10日
0080
kaggle点赞最多的泰坦尼克号数据竞赛模型融合方法(附代码)

听说很多大佬都是从kaggle上获取的知识, 加工整理成一套属于自己的竞赛体系今年7月份我开始参加大数据竞赛, 现在差不多有10场比赛了, 都是结构化比赛. 小的比赛还能进Top…

人工智能 2023年6月11日
00154
在PyTorch中，如何加载和处理图像数据集

问题：如何在PyTorch中加载和处理图像数据集？详细介绍：在深度学习中，处理图像数据集是一个常见的任务。PyTorch是一种广泛使用的深度学习框架之一，提供了方便的API来加…

人工智能 2024年1月2日
0062
模型训练完准确率为0的解决方法,以及模型验证方法(resize和reshape区别)

目录模型训练完准确率一直为0 完整的模型验证套路：test reshape和reszie的区别 debug方法模型训练完准确率一直为0 计算准确率或者输出看loss、准确率时，…

人工智能 2023年7月21日
0069
阅读目标检测综述论文

阅读论文Imbalance Problems in Object Detection: A Review 一、目标检测整体模型框架介绍（针对Anchor-based）上图为anc…

人工智能 2023年7月10日
0074

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Tensorflow训练数字识别数据集并部署在OpenCV上

大家都在看