yolov5和rknn模型的问题

2023年7月21日下午5:45 • 人工智能 • 阅读 51

rknn官方目前1.7.0
对新算子的支持还没跟上, 需要将yolov5中的模型做下面的改变,
改变之后 重新训练新的模型. 再去转onnx, 然后转rknn

(吐槽一下, rknn官方真是效率太低了. 售后也很不到位, 恨不得去咬他两口.)

额, 下文其实都是抄自
https://github.com/EASY-EAI/yolov5
https://github.com/littledeep/YOLOv5-RK3399Pro
其中 YOLOv5-RK3399Pro 属于功能比较全面的项目.

建议不要使用官方的yolov5 模型, 官方的由于更新太快了, rknn的速度跟不上, 训练和转换模型是往往会出现各种各样的算子不支持的问题. 还是使用 YOLOv5-RK3399Pro 比较好.

其实下面的文章你可以不看, 去下载 https://github.com/littledeep/YOLOv5-RK3399Pro
把, 训练的时候可能会遇到点小问题,

记得模型转换onnx的时候要把 opset 改成 11
把训练的weights 参数改成 ” 空字符串, 这样是全新的训练. 不用下载官方模型.

其它的我就不啰嗦了,

关于转换, 说一下我对这个库的总结.

如果yolov5 导出的onnx包含了 Detect层, 也就是最后一层, 会在onnx转rknn的时候出现各种失败. 所以一定要在导出onnx的时候把 Detect层去掉. YOLOv5-RK3399Pro的model/export.py 中 , –grid 一定要设置为False

parser.add_argument('--grid', default=False, action='store_true', help='export Detect() layer grid')

–rknn_mode 要默认True

if __name__ == '__main__':
    parser = argparse.ArgumentParser()
    parser.add_argument('--weights', type=str, default=r'F:\project\AI\yolov5_3399pro\best.pt', help='weights path')
    parser.add_argument('--img-size', nargs='+', type=int, default=[640, 640], help='image size')
    parser.add_argument('--batch-size', type=int, default=1, help='batch size')
    parser.add_argument('--dynamic',  action='store_true', help='dynamic ONNX axes')
    parser.add_argument('--grid', default=False, action='store_true', help='export Detect() layer grid')
    parser.add_argument('--device', default='cpu', help='cuda device, i.e. 0 or 0,1,2,3 or cpu')
    parser.add_argument('--rknn_mode', default=True, action='store_true', help='export rknn-friendly onnx model')
    parser.add_argument('--ignore_output_permute', action='store_true', help='export model without permute layer,which can be used for rknn_yolov5_demo c++ code')
    parser.add_argument('--add_image_preprocess_layer',default=False,  action='store_true', help='add image preprocess layer, benefit for decreasing rknn_input_set time-cost')
    opt = parser.parse_args()

在第 161行, 这里我写死了onnx 输出的3个节点, 改成了下面的3个名字. 后面转rknn的时候就定死即可.


        output_names=['output80x', 'output40x','output20x'],

onnx 转rknn 我用了我自己的代码. 比较简洁. 易懂.

onnx2rknn.py


from rknn.api import RKNN

INPUT_SIZE = 64

if __name__ == '__main__':

    rknn = RKNN()

    add_perm = False
    rknn.config(
        batch_size=1,
        mean_values=[[0, 0, 0]],
        std_values=[[255, 255, 255]],
        reorder_channel='0 1 2',
        force_builtin_perm=add_perm,
        output_optimize=1,
        target_platform='rk3399pro')

    print('--> Loading model')

    ret = rknn.load_onnx(  model='best.onnx' ,
        inputs=['images'],
        outputs=['output80x', 'output40x','output20x'],
        input_size_list=[[3,640,640]],)
    if ret != 0:
        print('Load  onnx  failed!')
        exit(ret)
    print('done')

    print('--> Building model')
    rknn.build(do_quantization=True)
    print('done')

    ret = rknn.export_rknn('./best.rknn')
    if ret != 0:
        print('Export  rknn failed!')
        exit(ret)
    else:
        print('Export  rknn success!')

    rknn.release()

识别用的代码用的是. YOLOv5-RK3399Pro 中的
rknn_detect\rknn_detect_for_yolov5_original.py
代码我就不贴了.

整体能跑通显示图片了, 等我训练出一个合适的模型再继续测试.

下面的你可以不看.直接用上面的库就能正常训练和转换
下面的你可以不看.直接用上面的库就能正常训练和转换
下面的你可以不看.直接用上面的库就能正常训练和转换
下面的你可以不看.直接用上面的库就能正常训练和转换
下面的你可以不看.直接用上面的库就能正常训练和转换

改变如下:

将Focus层改成Conv层
将Swish激活函数改成Relu激活函数
将大kernel_size的MaxPooling改成3×3 MaxPooling Stack结构

第一个将Focus层改成Conv层, 参考自 @Shmily丶

将 common.py 的


class Focus(nn.Module):

    def __init__(self, c1, c2, k=1, s=1, p=None, g=1, act=True):
        super().__init__()
        self.conv = Conv(c1, c2, k, s, p, g, act)

    def forward(self, x):
        return self.conv(x)

将Swish激活函数改成Relu激活函数
这个比较简单, 因为Swish激活函数是最新出的算法, 所以rknn还没来得及支持.

改变方法也很简单目前版本V6.0 只需要改两个地方.

将 common.py 的


 self.act = nn.SiLU() if act is True else (act if isinstance(act, nn.Module) else nn.Identity())

 self.act = nn.ReLU() if act is True else (act if isinstance(act, nn.Module) else nn.Identity())

将export.py中

  m.act = SiLU()

  m.act = nn.ReLU()

第三个,将大kernel_size的MaxPooling改成3×3 MaxPooling Stack结构

别人转换后的结构, 如上图, 但是代码还不知道怎么写…

关于yolov5 输出结果结构的后处理

据网友说 rknn-toolkit的github issue有人问过这个问题，也有对应的答复。但是我没搜到。
这个输出0的结构是 1 * 25200 * 85

网友提示 25200=40 _40_3 + 20 _20_3 + 80 _80_3
所以应该怎么解这个矩阵应该也是比较容易理解的了.

关于输出结构后处理可以参考文章.

https://cumtchw.blog.csdn.net/article/details/120860799

如果你的项目模型转换正常了,也不报错了, 但是识别不了.
问题可能出在 img = img[…, ::-1] 这里.

代码在下面

rknn_detect\rknn_detect_for_yolov5_original.py 文件中.

不需要拆分 start
和
不需要拆分 end
之间的注释掉.

这里是对原图片进行了,切割拆分, 重组.

  def _predict(self, img_src, img, gain):
        src_h, src_w = img_src.shape[:2]

        pred_onx = self._rknn.inference(inputs=[img])

        boxes, classes, scores = [], [], []
        for t in range(1,3):
            input0_data = sigmoid(pred_onx[t][0])
            input0_data = np.transpose(input0_data, (1, 2, 0, 3))
            grid_h, grid_w, channel_n, predict_n = input0_data.shape

参考文章:

https://github.com/rockchip-linux/rknpu/tree/master/rknn/rknn_api/examples/rknn_yolov5_demo (官方的必看)

https://github.com/rockchip-linux/rknpu
https://github.com/EASY-EAI/yolov5

Original: https://blog.csdn.net/phker/article/details/121084160
Author: 走错路的程序员
Title: yolov5和rknn模型的问题

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/707540/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

使用Pytorch中的Dataset类构建数据集的方法及其底层逻辑

1 前言我们在用Pytorch开发项目的时候，常常将项目代码分为数据处理模块、模型构建模块与训练控制模块。数据处理模块的主要任务是构建数据集。为方便深度学习项目构建数据集，Pyt…

人工智能 2023年6月16日
0078
Pandas的基本属性和操作(增,删,改,查,合并)

官方文档 Pandas官网基本属性显示详细 `pythonimport pandas as pdd1 = pd.DataFrame({ “姓名”: [&…

人工智能 2023年7月8日
00102
python+opencv实现高斯滤波（手写滤波函数）

用opencv进行一些图像处理的操作非常的简单和便捷了，但是对于想要了解详细内容的同学来说，最好是可以手写一下滤波核的生成以及滤波函数。了解高斯函数的变化过程，对我们深入学习图像处…

人工智能 2023年7月20日
0093
Colmap学习一：基础知识（坐标系、相机模型、整体框架）

1.colmap坐标系： a. 左上角坐标是（0.5，0.5）为了双线性插值 b. 坐标系方向xyz分别是红绿蓝、右下前 c. colmap的pose是 word2camera的…

人工智能 2023年5月26日
00249
动手学深度学习（二十八）——目标物体检测+多尺度目标检测

文章目录 * – 一、目标检测任务概述 – 二、目标检测和边界框 – + 2.1 锚框定义及相关基础知识 + 2.2 基于锚框的目标检测算法 +…

人工智能 2023年7月12日
0073
java计算机毕业设计高校图书馆管理网站源码+mysql数据库+系统+lw文档+部署

本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：idea eclipse 前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAV…

人工智能 2023年6月29日
0092
利用yolov7训练自己的数据集； yolov7的安装与使用； yolov7源码解读

免责声明:1\此方法仅提供参考2\搬了其他博主的操作方法,以贴上路径.3* 场景一:Anconda环境基本操作场景二:yolov7的使用场景三:yolov7训练自己的数据集场…

人工智能 2023年7月29日
0062
神经网络与tf.keras读取图片-关于导入部分“from tensorflow.python.keras.preprocessing.image import load_img”的问题

昨天，我开始自主学习关于#神经网络与tf.keras读取图片以及数据集的相关内容。信心满满的照着教程、视频敲下了代码： from tensorflow.python.keras….

人工智能 2023年7月13日
0050
ViT结构详解（附pytorch代码）

参考这篇文章，本文会加一些注解。源自paper:AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION…

人工智能 2023年7月4日
0083
OpenGL ES 2.0 和 3.0区别

目录一.嵌入式设备的 OpenGL ES 版本二.兼容性三.着色器脚本 1.OpenGL ES shader 2.0 2.OpenGL ES shader 3.0 3.版本声…

人工智能 2023年6月18日
0070
ROS学习笔记（一）：ROS noetic的安装

前言 ROS是一个机器人操作系统，机器人的不同模块之间的数据传输都在ROS上进行，下面记录一下ROS noetic的安装和基本使用一、预备 ROS的不同版本和Ubuntu的不同版…

人工智能 2023年6月1日
00146
2021年7月20日，使用yolov5训练摔倒检测模型，效果超乎你想象！！！

1.准备阶段，配置好自己的cuda 10.0环境，这里我就不多说了，网上教程太多了。在cmd中输入nvcc -V,最终结果显示下图即确定你的cuda 10.0环境安装成功。2.去g…

人工智能 2023年6月16日
0094
计算机图像处理学习笔记 2022 3 02

255 对应白色块像素高电压为白色 for(j=0;j Original: https://blog.csdn.net/DoKiDoK/article/details/123236…

人工智能 2023年6月22日
0056
【梯度下降法】详解优化算法之梯度下降法（原理、实现）

1、梯度下降法的介绍梯度下降法（Gradient descent，简称 GD）是一阶最优化算法。要使用梯度下降法找到一个函数的局部极小值，必须向函数上当前点对应梯度（或者是近似…

人工智能 2023年6月12日
0098
学习笔记——tensorflow1.14.0环境安装（win10）

选择win 64位下载即可。下载后exe安装，可能需要注意的是会询问你是否添加到环境变量中，可以选择不添加，以后开Anaconda可以用开始里面的Anaconda Prompt打开…

人工智能 2023年5月25日
0096
R语言使用xgboost构建回归模型：vtreat包为xgboost回归模型进行数据预处理（缺失值填充、缺失值标识、离散变量独热onehot编码）、构建出生体重的xgboost模型回归模型

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月18日
0091

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

yolov5和rknn模型的问题

大家都在看