2021电赛F题送药小车视觉部分的一种思路（双OpenMV法）

2023年6月2日上午4:09 • 人工智能 • 阅读 93

使用两块OpenMV解答送药小车视觉部分

前言：
最近参加了2021年电赛的F题，因为诸多原因未能完赛，现将图像识别部分的记录一下，交流学习。

使用两块OpenMV解答送药小车视觉部分
一、2021电赛F题题目回顾与分析
*
1.题目介绍
2.图像部分分析
–
- 2.1识别道路
- 2.2识别数字
二、识别道路部分
*
1.巡线-红色实线
2.终点线-黑色虚线
3.代码实现
4.接口定义
–
三、识别数字部分
*
1.总体思路
–
2.代码实现
3.识别效果
四、总结反思

一、2021电赛F题题目回顾与分析

1.题目介绍

因为只介绍视觉部分，我们就节选相关的部分吧。

设计并制作智能送药小车，模拟完成在医院药房与病房间药品的送取作业。院区结构示意如图 1 所示。院区走廊两侧的墙体由黑实线表示。走廊地面上画有居中的红实线，并放置标识病房号的黑色数字可移动纸张。药房和近端病房号（1、 2 号）如图 1 所示位置固定不变，中部病房和远端病房号（3-8 号）测试时随机设定。

工作过程：参赛者手动将小车摆放在药房处（车头投影在门口区域内，面向病房），手持数字标号纸张由小车识别病房号，将约 200g 药品一次性装载到送药小车上；小车检测到药品装载完成后自动开始运送；小车根据走廊上的标识信息自动识别、寻径将药品送到指定病房（车头投影在门口区域内），点亮红色指示灯，等待卸载药品；病房处人工卸载药品后，小车自动熄灭红色指示灯，开始返回；小车自动返回到药房（车头投影在门口区域内，面向药房）后，点亮绿色指示灯。

; 2.图像部分分析

由题意可知，图像部分大致可以分为

识别道路
路中央红线巡线
路口识别
终点线黑色虚线识别
识别数字
开始位置识别数字
路口识别两个数字
路口识别四个数字

2.1识别道路

识别道路有很多方案，我们组前期错误的选择了红外循线的方案。这种方案精度低，而且会受环境影响。

后期转向OpenMV的方案。

2.2识别数字

识别数字有很多方案，比如OpenMV、K210、树莓派、Jetson nano甚至x86架构的单板计算机都可以用，但是因为前期准备的原因我们只实现了OpenMV的方案。

这里还是要说一下，OpenMV算力有限，实在是难堪重任，并不是本题的最优解法。

二、识别道路部分

1.巡线-红色实线

这里我们采用的是匿名飞控给无人机写的一套OpenMV代码，略作修改。

核心思想是在图像的上、中、下、左、右各划出一个细长条的区域，在各自区域内检测是否有指定大小的红色色块，再根据五个部分红色色块的有无即可判定是直线还是路口、是何种路口以及直线的倾角和偏移量。

如下图所示，左边只有上、中、下有小方框，是直线；右边上、中、下、左、右都有小方框，是路口。

; 2.终点线-黑色虚线

终点线是黑色虚线，可以视为两厘米见方的黑色小矩形，可以使用OpenMV内置的矩形检测函数检测指定大小范围的矩形，当矩形数量足够多时即视为终点线。

如下图所示，识别到六个以上矩形块即可视为终点线。

3.代码实现

import sensor, image, time, math, struct
from pyb import UART
import json
sensor.reset()
sensor.set_pixformat(sensor.RGB565)

sensor.set_framesize(sensor.QQVGA)

sensor.skip_frames(time=3000)
sensor.set_auto_whitebal(False)

clock = time.clock()
uart = UART(1, 115200)
uart.init(115200, bits=8, parity=None, stop=1)

Red_threshold =[(13, 40, -2, 57, 11, 47),(29, 50, 13, 79, 15, 67),(33, 50, 16, 73, 2, 61)]

ROIS = {
    'down':   (0, 105, 160, 15),
    'middle': (0, 52,  160, 15),
    'up':    (0,  0,  160, 15),
    'left':   (0,  0,  15, 120),
    'right':  (145,0,  15, 120),
    'All':  (0,  0,  160,120),
}

class LineFlag(object):
    flag = 0
    cross_y = 0
    delta_x = 0
class EndFlag(object):
    endline_type = 0
    endline_y = 0
LineFlag=LineFlag()
EndFlag=EndFlag()

def find_blobs_in_rois(img):
    global ROIS
    roi_blobs_result = {}
    for roi_direct in ROIS.keys():
        roi_blobs_result[roi_direct] = {
            'cx': -1,
            'cy': -1,
            'blob_flag': False
        }
    for roi_direct, roi in ROIS.items():
        blobs=img.find_blobs(Red_threshold, roi=roi, merge=True, pixels_area=10)
        if len(blobs) == 0:
            continue
        largest_blob = max(blobs, key=lambda b: b.pixels())
        x,y,width,height = largest_blob[:4]
        if not(width >=3 and width  45 and height >= 3 and height  45):
            continue
        roi_blobs_result[roi_direct]['cx'] = largest_blob.cx()
        roi_blobs_result[roi_direct]['cy'] = largest_blob.cy()
        roi_blobs_result[roi_direct]['blob_flag'] = True

    if (roi_blobs_result['down']['blob_flag']):
        if (roi_blobs_result['left']['blob_flag']and roi_blobs_result['right']['blob_flag']):
            LineFlag.flag = 2
        elif (roi_blobs_result['left']['blob_flag']):
            LineFlag.flag = 3
        elif (roi_blobs_result['right']['blob_flag']):
            LineFlag.flag = 4
        elif (roi_blobs_result['middle']['blob_flag']):
            LineFlag.flag = 1
        else:
            LineFlag.flag = 0
    else:
        if(roi_blobs_result['middle']['blob_flag']and roi_blobs_result['up']['blob_flag']):
            if (roi_blobs_result['left']['blob_flag']and roi_blobs_result['right']['blob_flag']):
                LineFlag.flag = 5
            elif (roi_blobs_result['left']['blob_flag']):
                LineFlag.flag = 6
            elif (roi_blobs_result['right']['blob_flag']):
                LineFlag.flag = 7
            else:
                LineFlag.flag = 8
        else:
            LineFlag.flag = 0

    if (LineFlag.flag == 3 and roi_blobs_result['left']['cy']<10):
        LineFlag.flag = 1
    if (LineFlag.flag == 4 and roi_blobs_result['right']['cy']<10):
        LineFlag.flag = 1
    if (LineFlag.flag == 3 and roi_blobs_result['down']['cx']<30):
        LineFlag.flag = 1
    if (LineFlag.flag == 4 and roi_blobs_result['down']['cy']>130):
        LineFlag.flag = 1

    LineFlag.cross_y = 0
    LineFlag.delta_x = 0

    if (LineFlag.flag == 1 or LineFlag.flag == 2 or LineFlag.flag == 3 or LineFlag.flag == 4) :
        LineFlag.delta_x = roi_blobs_result['down']['cx']
    elif (LineFlag.flag == 5 or LineFlag.flag == 6 or LineFlag.flag == 7 or LineFlag.flag == 8):
        LineFlag.delta_x = roi_blobs_result['middle']['cx']
    else:
        LineFlag.delta_x = 0

    if (LineFlag.flag == 2 or LineFlag.flag == 5):
        LineFlag.cross_y = (roi_blobs_result['left']['cy']+roi_blobs_result['right']['cy'])//2
    elif (LineFlag.flag == 3 or LineFlag.flag == 6):
        LineFlag.cross_y = roi_blobs_result['left']['cy']
    elif (LineFlag.flag == 4 or LineFlag.flag == 7):
        LineFlag.cross_y = roi_blobs_result['right']['cy']
    else:
        LineFlag.cross_y = 0

def find_endline(img):
    endbox_num = 0
    for r in img.find_rects(threshold = 10000):
        endbox_size = r.magnitude()
        endbox_w = r.w()
        endbox_h = r.h()
        k=1

        if (endbox_size<24000*k*k and endbox_h<25*k and endbox_w<25*k) :
            endbox_num = endbox_num + 1;

    EndFlag.endline_type = 0
    if (endbox_num>2 and endbox_num<6):
        EndFlag.endline_type = 1
    elif(endbox_num >=6 ):
        EndFlag.endline_type = 2
    else:
        EndFlag.endline_type = 0

while(True):
    clock.tick()
    global img
    img = sensor.snapshot()

    img = img.replace(vflip=1,hmirror=1,transpose=0)

    find_blobs_in_rois(img)

    find_endline(img)

    FH = bytearray([0xc3,0xc3])
    uart.write(FH)

    data = bytearray([LineFlag.flag, LineFlag.delta_x, LineFlag.cross_y, EndFlag.endline_type])
    uart.write(data)

    ED = bytearray([0xc4,0xc4])
    uart.write(ED)

4.接口定义

Line.flag

数值含义00未检测到直线01直线02十字路口或丁字路口03左转路口（顶部10像素以下）04右转路口（顶部10像素以下）05即将跨过十字路口（无down块）06即将跨过左拐丁字路口（无down块）07即将跨过右拐丁字路口（无down块）08直线（无down块）

LineFlag.delta_x

数值含义0~160赛道红色中心线底部的X轴水平位置，
左小右大

；无down块时，返回中部的middle块X轴水平位置

LineFlag.cross_y

数值含义0~120赛道红色中心线十字路口或丁字路口交叉点的Y轴竖直位置，
上小下大

EndFlag.endline_type

数值含义00未检测到终点线01检测到第一根终点线02检测到第二根终点线

三、识别数字部分

1.总体思路

1.1 识别方法

由题目可知，我们要同时识别两个或四个数字，这里有很多办法，我们的办法是让相机尽可能加高、使用广角镜头以便同时能看到四个数字。

如下图所示，小车的高度刚好卡在了25cm的限高，以便同时看到四个数字。

我们再图像内划分出了五个ROI区域，依次检测，即可检测到处于五种不同位置的数字了。

; 1.2 模型训练

OpenMV可以跑TensorFlow Lite模型，具体如何训练可以参考下面这篇博客。

https://blog.csdn.net/qq_36300069/article/details/118071444

训练模型的网站如下

https://studio.edgeimpulse.com/

这个网站可以把模型打包好导入OpenMV中，数据集是自己拍的照片，一共八十张训练集、二十张测试集。参数上我选择的是160*160像素、灰度图、训练100步，模型选的0.35的V2模型。

数据集如下图所示，左边是训练集，右边是测试集。

训练结束后取得了不错的效果，识别准确率都在70%以上。

; 1.3 图像处理

仅仅是神经网络模型识别准确率还不高，我们使用了一些方法对图像进行一些处理来提高识别的成功率。

镜头畸变校正
缩小图像（避免画面损失）
翻转图像（因为倒装）
透视校正
反相、红色填充黑色后再反相（去除红色影响）

如下图所示，左侧是未处理的图像，右图是处理后的图像。

总体流程如下

2.代码实现

import sensor, image, time, os, tf
from pyb import UART
import json

sensor.reset()
sensor.set_pixformat(sensor.RGB565)
sensor.set_framesize(sensor.VGA)
sensor.skip_frames(time=2000)

net = "trainedv13.tflite"

TARGET_POINTS = [(143,210),
                 (495,214),
                 (640,480),
                 (0,480)]

ROI0 = (210,170,170,170)
ROI1 = (20,0,170,170)
ROI2 = (150,0,170,170)
ROI3 = (285,0,170,170)
ROI4 = (430,0,170,170)

xred_threshold = (51, 84, -31, -3, -26, -2)

keyline_0 = 0.7
keyline_1 = 0.6
keyline_2 = 0.65
keyline_3 = 0.65
keyline_4 = 0.6

ans_num = 0

clock = time.clock()

uart = UART(3, 115200)
uart.init(115200, bits=8, parity=None, stop=1)

while(True):
    clock.tick()

    img = sensor.snapshot().lens_corr(strength = 1.7, zoom = 0.55)
    img = img.replace(vflip=1,hmirror=1,transpose=0)
    img = img.rotation_corr(corners = TARGET_POINTS)
    img = img.negate()
    img = img.binary([xred_threshold], invert=False, zero=True)
    img = img.negate()

    for obj in tf.classify(net, img, roi=ROI0, min_scale=1.0, scale_mul=0.8, x_overlap=0.5, y_overlap=0.5):
        out = obj.output()
        max_idx = out.index(max(out))

        if max(out)>keyline_0:
            ans_0 = max_idx + 1
        else:
            ans_0 = 0

    for obj in tf.classify(net, img, roi=ROI1, min_scale=1.0, scale_mul=0.8, x_overlap=0.5, y_overlap=0.5):
        out = obj.output()
        max_idx = out.index(max(out))

        if max(out)>keyline_1:
            ans_1 = max_idx + 1
        else:
            ans_1 = 0

    for obj in tf.classify(net, img, roi=ROI2, min_scale=1.0, scale_mul=0.8, x_overlap=0.5, y_overlap=0.5):
        out = obj.output()
        max_idx = out.index(max(out))

        if max(out)>keyline_2:
            ans_2 = max_idx + 1
        else:
            ans_2 = 0

    for obj in tf.classify(net, img, roi=ROI3, min_scale=1.0, scale_mul=0.8, x_overlap=0.5, y_overlap=0.5):
        out = obj.output()
        max_idx = out.index(max(out))

        if max(out)>keyline_3:
            ans_3 = max_idx + 1
        else:
            ans_3 = 0

    for obj in tf.classify(net, img, roi=ROI4, min_scale=1.0, scale_mul=0.8, x_overlap=0.5, y_overlap=0.5):
        out = obj.output()
        max_idx = out.index(max(out))

        if max(out)>keyline_4:
            ans_4 = max_idx + 1
        else:
            ans_4 = 0

    FH = bytearray([0xc3,0xc3])
    uart.write(FH)

    data = bytearray([ans_1, ans_2, ans_3, ans_4, ans_0])
    uart.write(data)

    ED = bytearray([0xc4,0xc4])
    uart.write(ED)

3.识别效果

实际识别效果尚可，但是帧率极低，联机状态只有大约0.4fps。

四、总结反思

只识别两个区域即可。四个数字的路口如果检测不到就随便去一个，走错了再掉头就好。可以提升帧率。
结合上一条，如果有两块OpenMV各自识别一个数字，帧率提升更明显。
结合上一条，将OpenMV换成K210，识别效果和帧率会更好。实际完赛的组大多是使用这个方法的。
如果使用树莓派或者jetson nano自然更好，也有部分组别用了这个方法。
电赛控制题日趋智能化，树莓派和神经网络模型将会逐渐成为常态。

Original: https://blog.csdn.net/DCCSDNDC/article/details/121249961
Author: DCcsdnDC
Title: 2021电赛F题送药小车视觉部分的一种思路（双OpenMV法）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/559609/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python机器学习 train_test_split()函数用法解析及示例划分训练集和测试集以鸢尾数据为例入门级讲解

文章目录 train_test_split()用法获取数据划分训练集和测试集完整代码脚手架 train_test_split()用法 python机器学习中常用 train_…

人工智能 2023年7月5日
0058
❀资源帖❀ResNet，ConvNeXt,Transformer预训练模型等

1:说在前面部分输入网页直接开始下载,一些是自己训练后的模型。 2.resnet权重文件下载地址： 2.1resnet18: https://download.pytorch.o…

人工智能 2023年5月28日
00108
辅助驾驶功能开发-功能规范篇(04)- 交通拥堵辅助及集成式巡航辅助TJA/ICA

1. 交通拥堵辅助及集成式巡航辅助功能概述 TJA/ICA在全速度范围内为驾驶员提供车辆的纵向和横向辅助。纵向辅助由ACC系统实现，将自身车辆维持在固定的车速或者与前方道路使用者…

人工智能 2023年6月10日
00110
CVPR2022论文速递（2022.3.22）！共25篇多篇3D目标检测

整理：AI算法与图像处理 CVPR2022论文和代码整理：https://github.com/DWCTOD/CVPR2022-Papers-with-Code-Demo 欢迎关注…

人工智能 2023年7月9日
0051
TensorFlow中的目标检测算法是如何实现的

详细介绍 TensorFlow中的目标检测算法是一种计算机视觉算法，用于检测图像或视频中特定对象的位置和类型。其主要目标是在给定一张图像后，输出图像中所有感兴趣的目标的边界框和类别…

人工智能 2023年12月31日
0068
一.无人车导航：CMU团队开源自主导航和规划算法框架

之前的文章汇总：多传感器融合SLAM部分：开源框架测试一：Tixiao Shan最新力作LVI-SAM(Lio-SAM+Vins-Mono)，基于视觉-激光-惯导里程计的SL…

人工智能 2023年7月27日
0055
配置pytorch（cuda11.1）

之前已经装过CUDA和cudNN了 1.查看CUDA版本：nvcc -V 2.查看cuDNN版本：找到自己安装的CUDA的地方（我在D盘），找到cudnn_version.h文件…

人工智能 2023年5月28日
0072
基于KNN的垃圾邮件分类实验

本次实验中我使用到的是I. Androutsopoulos, J. Koutsias, K.V. Chandrinos, George Paliouras和 C.D. Spyrop…

人工智能 2023年7月3日
0073
一文读懂层次聚类（Python代码）

大家好，我是东哥。本篇想和大家介绍下层次聚类，先通过一个简单的例子介绍它的基本理论，然后再用一个实战案例 Python代码实现聚类效果。首先要说，聚类属于机器学习的无监督学习…

人工智能 2023年7月6日
0067
图数据挖掘 ECC K-core core number truss number clique

K-core:什么叫k-core，给定一个正整数k（k>=0），k-core是一个G的最大子图（也就是说k-core是一个图的限制），将这个子图定义为Hk，对于Hk中的每个顶…

人工智能 2023年6月1日
00114
Mac Pro M1测试PyTorch GPU

文章目录前言安装开始测试总结前言这几天暑假回家被社区集中隔离，进来就带了台笔记本每天实在是太无聊了。想起来之前刷到最新版本的Pytorch貌似已经支持M1芯片的GPU加…

人工智能 2023年7月20日
0098
点云特征提取及分类、VFH、SVM、CNN

随着激光雷达，RGBD相机等3D传感器在机器人，无人驾驶领域的广泛应用。针对三维点云数据的研究也逐渐从低层次几何特征提取（ PFH, FPFH,VFH等）向高层次语义理解过渡（点云…

人工智能 2023年6月15日
00156
用Python实现简单的人脸识别，10分钟搞定！（附源码）

前言让我的电脑认识我，我的电脑只有认识我，才配称之为我的电脑！今天，我们用Python实现简单的人脸识别技术！ Python里，简单的人脸识别有很多种方法可以实现，依赖于pyt…

人工智能 2023年7月3日
0073
timm——pytorch下的迁移学习模型库·详细使用教程

timm（Pytorch Image Models）项目是一个站在大佬肩上的图像分类模型库，通过timm可以轻松的搭建出各种sota模型（目前内置预训练模型592个，包含dense…

人工智能 2023年7月20日
0074
Embedding原理到实战

原创：王稳钺资料来源：张春阳词向量被应用在非常非常多的场景中，甚至可以说跟文字相关的互联网应用基本上都会跟词向量有关系。本文主要从应用、发展以及实战代码来介绍词向量。 1. 词向…

人工智能 2023年5月30日
0056
TPLinker实体关系抽取新范式TPLinker：单阶段联合抽取，并解决暴漏偏差～

https://zhuanlan.zhihu.com/p/342300800(https://zhuanlan.zhihu.com/p/342300800)https://zhua…

人工智能 2023年6月1日
0064

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31