opencv-python和yolo5(torch)实现实时检测

2023年7月20日上午1:53 • 人工智能 • 阅读 82

先下载yolo5项目：

https://github.com/ultralytics/yolov5

用pycharm新建一个项目
勾选Inherit global site-packages 使用base interpreter的所有packages
不勾选 Make available to all projects 因为这个指当在虚拟环境下安装包的时候，copy一份到全局。就是base interpreter中会添加这个项目中的所有包

项目新建后，把yolo5 解压后所有文件和文件夹复制到pycharm项目里面，把requirements.txt打开，这时候先不要用pycharm安装依赖包，先看看有哪些。
其中，matplotlib，numpy，opencv-python，scipy，torch，torchvision，pandas，seaborn这些是机器学习/深度学习中常用的工具包，所有应该安装在全局环境里面也就是base interpreter添加这个包

细节说明yolo5项目有成熟的torch框架实现，到现在并没有成熟的tensorflow框架板，而且torch和tensorflow都有cpu和gpu版本，如果你没有支持cuda的高性能显卡，或者图省事简单，安装cpu版本更适合俺们

先手动在cmd里面安装opencv python版
到

https://pypi.tuna.tsinghua.edu.cn/simple/opencv-python/

选择匹配你设备的whl文件
细节cp39（指对应你安装的python sdk的版本比如python39）
cmd窗口下pip install “pathxxxxx/.whl”
稍后安装成功

此时已经安装了opencv,我们来玩一玩，在新建一个python项目，在main下面添加以下代码

import cv2
capture = cv2.VideoCapture(0) #使用电脑的内置像头 1的话应该是usb外置像头
while (True):
        # 获取一帧
        ret, frame = capture.read()
        frame = cv2.flip(frame, 1)   #cv2.flip 图像翻转,因为摄像头本来录制的是与现实相反的
        cv2.imshow('frame',frame)
        # 如果输入q，则退出
        if cv2.waitKey(1) == ord('q'):
            break
capture.release()
cv2.destroyAllWindows()

没有意外的话，你就能看见自己英俊的脸庞。ok小的体验到此结束。

然后开始yolo

https://pypi.tuna.tsinghua.edu.cn/simple/matplotlib
https://pypi.tuna.tsinghua.edu.cn/simple/seaborn

下载他们的whl文件，这个是可视化显示所需要的，但是在我的文章中是用不到的，既然项目文件requirements.txt所要求的，那么我们还是当一个好学生吧。matplotlib是负责可视化的，seaborn是美化matplotlib的样式的

https://pypi.tuna.tsinghua.edu.cn/simple/numpy
https://pypi.tuna.tsinghua.edu.cn/simple/pandas

其实上面这几个安装比较简单，你要是图省事，也可用全部用pycharm的功能安装，不用手动了，因为后面torch，torchvision这两个有细节
细节1是torch cpu和gpu版本
细节2是torch得对应torchvision版本
用pycharm可以确保版本对应，但是你不支持gpu他可能会给你安装上gpu版本的torch，而且国外网络下载看你运气 torch 200mb
剩余的scipy包请自己拼接链接地址下载安装，没啥细节

再打开第一次新建的项目，就是你已经复制了yolo到里面去的那个，然后提示缺什么包，确认就ok，基本剩下的包不会占很大，会用pycharm自动安装上
然后用pycharm run运行detect.py就ok，其他文章中用cmd方式是一样的，默认参数有目标图片，不需要用cmd填写
运行过程中，如果是第一次运行，会下载模型文件，有网就ok
然后你就能看到控制台打印预测后的文件信息
这样的话yolo就ok了

剩下就是对open cv中的没一帧进行模型推到处理后再显示，我的电脑很垃圾，像放ppt。

import cv2
import numpy as np
import torch
from models.common import DetectMultiBackend
from utils.general import check_img_size,non_max_suppression
from utils.plots import Annotator, colors
from utils.torch_utils import select_device
from utils.augmentations import letterbox #调整图片大小至640

if __name__ == '__main__':
    # Load model
    device = select_device('')
    weights="C:\\Users\\Administrator\\Desktop\\yolov5s.pt"
    dnn = False
    data="C:\\Users\\Administrator\\Desktop\\coco128.yaml"
    model = DetectMultiBackend(weights, device=device, dnn=dnn, data=data)
    stride, names, pt, jit, onnx, engine = model.stride, model.names, model.pt, model.jit, model.onnx, model.engine
    imgsz = check_img_size((640, 640), s=stride)  # check image size

    model.warmup()  # warmup

    capture = cv2.VideoCapture(0)
    height = capture.get(cv2.CAP_PROP_FRAME_HEIGHT)  # 计算视频的高  # 获取视频宽度
    width = capture.get(cv2.CAP_PROP_FRAME_WIDTH)  # 计算视频的宽  # 获取视频高度

    #https://blog.csdn.net/weixin_41010198/article/details/88535234
    #capture.set(cv2.CAP_PROP_BRIGHTNESS,50)#亮度
    #capture.set(cv2.CAP_PROP_CONTRAST,18)#对比度
    #capture.set(cv2.CAP_PROP_SATURATION,70)# 图像的饱和度（仅适用于相机）
    #capture.set(cv2.CAP_PROP_EXPOSURE,200)
    #如果你感兴趣可以去调调参数

    while (True):
        # 获取一帧
        ret, frame = capture.read()
        #gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)  # 将这帧转换为灰度图
        frame = cv2.flip(frame, 1)   #cv2.flip 图像翻转

        img0=frame
        img = letterbox(frame)[0] #返回的是元组所以[0]
        # Convert
        img = frame.transpose((2, 0, 1))[::-1]  # HWC to CHW, BGR to RGB
        img = np.ascontiguousarray(img) #用tensor的说法 转为张量？

        im = torch.from_numpy(img).to(device)
        #im=im.half()
        im=im.float()  # uint8 to fp16/32 #转为float，除以255可以得小数
        im /= 255  # 0 - 255 to 0.0 - 1.0 #归一化

        if len(im.shape) == 3:
            im = im[None]  # expand for batch dim

        #im已经是预处理后的张量了，这才符合网络输入，而img0表示位图，帧
        pred = model(im, augment=False,visualize=False)#augmented inference  # visualize features增强推理#可视化特征
        # NMS 非极大值抑制
        pred = non_max_suppression(pred)
        det=pred[0]
        annotator = Annotator(frame, line_width=3, example=str(names))
        for *xyxy, conf, cls in iter(det):#一个图片里面可能不止一个目标对象，比如两个人，比如一人一狗，所以用循环
            c=int(cls)
            label =names[c]
            annotator.box_label(xyxy, label, color=colors(c, True))
        im0 = annotator.result()
        cv2.imshow('frame',im0)

        # 如果输入q，则退出
        if cv2.waitKey(1) == ord('q'):
            break

    capture.release()
    cv2.destroyAllWindows()

这上面的代码是根据官方detect.py文件，粘贴复制出来的，感兴趣的朋友可以自己对detect.py运行过程监听print看看，我这个自从图片上标示出来，想获得字符串可以自己去添加一下。
这个用的是yolo给的默认模型，根据场景需求，你可以自己训练，不算难，然后刚开始，我很介意这个是torch版本实现的，因为我只会tensorflow，根本不会torch，但是官方已经给了导出tf模型的py文件，在用自己的训练好后，我们转化一下就ok

对了，我本来是搞web的，最熟悉的还是java，目前最近几年会进一步学习人工智能，然后群号 517103280，这个QQ群，欢迎加入交流

cpu版本运行数据主要是模型推到没有cuda加速卡的，open cv直接显示不卡

如果想折腾，可以自己调调大小参数

这位大哥的文章不错，可以看下，然后yolo的一些应该得看看
https://blog.csdn.net/weixin_29343153/article/details/113090000?utm_source=app&app_version=4.16.0&code=app_1562916241&uLinkId=usr1mkqgl919blen

Original: https://blog.csdn.net/qq_37390245/article/details/122814191
Author: 民谣与狗
Title: opencv-python和yolo5(torch)实现实时检测

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/703995/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python 实现数据科学中的无监督挖掘技术

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月31日
0060
mask rcnn 将mask 转json数据01

目的：存在图片及其对应的mask 文件，通过Python代码转化为json 数据，无需手工制作 1、首先准备好图片和及其对应的mask ，使用的mask为黑底白色 #!/us…

人工智能 2023年5月26日
0077
图像超分——Real-ESRGAN快速上手

契源想必每个自媒体行业从业者都面临过这样一种情况：从网络上找到一张素材做封面，然而素材图片往往太模糊。那么，有没有办法对其进行高清修复呢？这就是计算机视觉领域的子领域图像超分所…

人工智能 2023年6月24日
0080
使用Pytorch实现深度学习的主要流程

一、使用Pytorch实现深度学习的主要流程使用Pytorch进行深度学习的实现流程主要包含如下几个部分：1、预处理、后处理并确认网络的输入和输出2、创建Dataset3、创建D…

人工智能 2023年6月26日
0039
如何在Kaggle上利用免费Gpu训练Yolox的模型

本文不包含Kaggle的入门步骤，如何上传数据集，如何选择GPU自行学习文章目录开头的话一、Kaggle的使用 * 1、为什么选择Kaggle 2、Kaggle的操作难度二…

人工智能 2023年6月17日
0081
手把手教你使用YOLOV5训练自己的目标检测模型-口罩检测-视频教程

手把手教你使用YOLOV5训练自己的目标检测模型大家好，这里是肆十二（dejahu），好几个月没有更新了，这两天看了一下关注量，突然多了1k多个朋友关注，想必都是大作业系列教程来…

人工智能 2023年5月31日
0083
基于opencv-ANN的水果识别模型训练

机器视觉—ANN 目录机器视觉—ANN 前言一、简化训练样本二、生成训练数据 1.读取样本 2.读取标签三、训练模型 1、转换数据集 2、创建模型 …

人工智能 2023年7月20日
0074
深度学习(1) ——图像分类

网络结构：这里大量使用了1×1的卷积，主要作用是实现跨通道的语义信息融合和降维减少参数量。实现： class Inception(tf.keras.layers.La…

人工智能 2023年7月29日
0068
融合中文字形和拼音的预训练模型：ChineseBERT（ACL2021）

不同于英文字母，中文的字形和拼音都有其独特的含义，例如’液’、’河’和’湖’都有相同的偏旁，其含义也有联系…

人工智能 2023年5月28日
0078
Pytorch-Lightning中的训练器—Trainer

参数名称含义默认值接受类型添加回调函数或回调函数列表None( 默认值)Union[List[Callback], Callback, None] 是否使用callbacksTr…

人工智能 2023年7月21日
0047
智能家居项目开发: 设计模式（工厂模式）+ 线程池 + Socket (持续更新中)

智能家居项目开发一、智能家居功能细节拆分 * 控制区：外设区：面向对象类和对象的概念结构体新玩法二、工厂模式 * 1. 工厂模式的概念 2. 工厂模式的实现 3. 工厂模…

人工智能 2023年5月27日
0059
python基础之字典的创建

博主简介：原互联网大厂tencent员工，网安巨头Venustech员工，阿里云开发社区专家博主，微信公众号java基础笔记优质创作者，csdn优质创作博主，创业者，知识共享者,欢…

人工智能 2023年7月4日
0039
钢材表面缺陷检测分类不同图像增强方式的对比研究

带钢表面缺陷检测分类不同图像增强方式的对比研究 * – 1、直接使用图像数据进行深度学习 – 2、图像增强 – + 图像分析 + 形态学top-…

人工智能 2023年5月24日
00104
无线数字语音核相仪的保养维护工作

无线数字语音核相仪是电力系统核对相位使用的一种仪器，可检测是否有电压的存在。是用于探测和指示在相同的额定电压和频率下，两个已带电部位之间正确相位关系的便携式装置。绝缘杆分为两部分…

人工智能 2023年5月25日
0061
【NLP】word2vec 模型

参考：《深度学习从0到1-基于Tensorflow2》【参考：深入浅出Word2Vec原理解析 – 知乎】总结 word2vec的前生 NNLM（神经网络语言模型）…

人工智能 2023年5月28日
00114
【复杂网络】实证网络可视化及其分析 – 含度分布，聚类系数，网络直径，度关联性，权重分析 (性质解析及代码)【python+networkx】

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年5月31日
0080

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

opencv-python和yolo5(torch)实现实时检测

大家都在看