使用 OpenCV 收集数据

2023年7月19日下午3:02 • 人工智能 • 阅读 65

OpenCV 是”开源计算机视觉”的缩写，是一个机器学习库，旨在实现图像处理和计算机视觉应用。与对象检测和识别相反，OpenCV 还有一个应用是它收集数据的能力。更准确地说，它可以通过在你的机器中本地保存图像来创建数据集。请允许我详细说明。

这是一个简单的代码片段。（我将使用 Python v 3.9.7 进行演示）

导入库：我们需要 Python 的 OpenCV 和 OS 库来执行数据收集。如果你没有预先安装这些软件包，你可以通过在命令提示符中执行以下命令来安装它们：

OpenCV: pip install opencv-python
OS: pip install os-sys

import cv2
import os

初始化：下一步涉及创建一个 VideoCapture 对象，该对象从系统的网络摄像头实时捕获视频。这是原始文档的链接：https://docs.opencv.org/4.x/dd/d43/tutorial_py_video_display.html

我们还需要三个变量：

flag_collecting：这是一个布尔变量，用作暂停/恢复按钮。
images_collected：这是一个整数变量，用于指示系统中收集和保存的图像数量。
images_required：这是一个整数变量，用于指示我们打算收集的图像数量。

然后，我们必须使用 OS 库中的mkdir（make-directory 的缩写）命令创建一个文件夹/目录（在本例中为 testing_demo ）。

cap = cv2.VideoCapture(0)

flag_collecting = False
images_collected = 0
images_required = 50

directory = 'testing_demo'
os.mkdir(directory)

代码的关键：如果这是你第一次使用 OpenCV，建议你阅读此文档以了解代码：https://docs.opencv.org/4.x/dd/d43/tutorial_py_video_display.html

将逐行解释对标准代码的所有修改，以确保它更容易理解。

第 3 行：使用flip()命令沿 y 轴翻转帧，以确保视频以正确的方式显示。

第 5 行：while 循环将持续运行，直到收集的图像等于所需的图像。

第 8 行：使用 cv2.rectangle 命令画一个黑色方块。

第 11-14 行：提取黑色方块内的切片帧或屏幕的一部分。然后我会将这些提取的帧保存在上面创建的目录中。这将产生尺寸为 240×240 像素的图像。

OpenCV 中坐标系的原点位于左上角。(80,320) 是从原点开始的 y 坐标，它随着向下移动而增加。(380, 620) 是从原点开始的 x 坐标，它随着向右移动而增加。所以 (380, 80) 和 (620, 320) 对应黑色方块的左上角和右下角坐标。

第 16-18 行：显示在给定坐标处收集的图像数量。

第 21–22 行：键盘字符”s”（用于开始/停止）用于暂停或恢复图像收集。它本质上是一个切换按钮。

第 23 行：键盘字符 ‘q’（用于退出）用于关闭窗口

while True:
    ret, frame = cap.read()
    frame = cv2.flip(frame, 1)

    if images_collected == images_required:
        break

    cv2.rectangle(frame, (380,80),(620,320), (0, 0, 0), 3)

    if flag_collecting == True:
        sliced_frame = frame[80:320,380:620]
        save_path = os.path.join(directory, '{}.jpg'.format(images_collected + 1))
        cv2.imwrite(save_path, sliced_frame)
        images_collected += 1

    cv2.putText(frame, "Saved Images: {}".format(images_collected), (400, 50),
                cv2.FONT_HERSHEY_SIMPLEX, 0.7, (0, 0, 0), 2)
    cv2.imshow("Data Collection", frame)

    k = cv2.waitKey(10)
    if k == ord('s'):
        flag_collecting = not flag_collecting
    if k == ord('q'):
        break

print(images_collected, "images saved to directory")
cap.release()
cv2.destroyAllWindows()

应用：最初使用这种技术收集手部符号的图像来创建图像数据集（数据集可以在 Kaggle 上获得：https://www.kaggle.com/datasets/abhinowww/hand-cricket-symbols。你可以用任何东西创建图像数据集。发挥创意！

实施：已经添加了这个代码的一些图像。建议你在身后有一面空白墙壁来收集数据，以确保框架中没有外部噪音。

下图是在运行代码之后，在按下键盘上的字符”s”之前拍摄的，这将启动图像收集过程。

图像收集前的初始状态

现在这张图片是在运行代码并按键”s”之后拍摄的。如你所见，收集的图像数量显示在黑色方块上方。这个黑色方块的大小可以根据用户的意愿更改为任何形状或大小。

图像收集过程中的中间状态

这是图像收集的结果。

收集的样本图像

这是遇到过的收集和格式化图像数据的最简单方法之一！

☆ END ☆

如果看到这里，说明你喜欢这篇文章，请转发、点赞。微信搜索「uncle_pn」，欢迎添加小编微信「 woshicver」，每日朋友圈更新一篇高质量博文。

↓ 扫描二维码添加小编↓

Original: https://blog.csdn.net/woshicver/article/details/126476566
Author: woshicver
Title: 使用 OpenCV 收集数据

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/703069/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

数字图像处理-图像分割-复习总结

文章目录数学图像处理 * 图像分割 – 图像分割基础基于边界的图像分割（非连续性分割） + 边缘检测一阶差分算子（掌握）二阶差分算子边缘检测算子的比较（掌握）…

人工智能 2023年7月19日
0075
Windows10使用MMrotate（初学），并训练自己的数据集

安装环境 Windows10安装mmrotate的步骤其实和linux一样的首先检查自己所用的显卡以及对应的CUDA版本我这里使用的是NVIDIA 3080TI安装的CUDA版…

人工智能 2023年7月23日
0049
【python系列】如何切换Jupyter Notebook的Python环境

切换Jupyter Notebook的Python环境有两种方法* 方法一：在Anaconda Prompt中切换 ** 第一步：在Anaconda Prompt中输入: con…

人工智能 2023年7月13日
00156
Transformer及其在low-level vision中的应用

Transformer是最近比较火的深度学习模型，它抛弃了传统的CNN和RNN，提出了一种全新的模型架构。借助于新的模型和大规模数据训练，transformer刷新了NLP和CV许…

人工智能 2023年6月20日
00108
PyTorch 实现联邦学习FedAvg （详解）

PyTorch 实现联邦学习FedAvg （详解）开始做第二个工作了，又把之前看的FedAvg的代码看了一遍。联邦学习好难啊… 1. 介绍简单介绍一下FedAvg …

人工智能 2023年6月16日
00113
pytorch分布式系列1——搞清torch.distributed.launch相关的环境变量

试验1：搞清torch.distributed.launch相关的环境变量试验用到的code： train.py import torch import torch.distri…

人工智能 2023年7月13日
0055
An Image is worth 16×16 words：transformers for image recognition at scale

摘要虽然Transformer架构已经是NLP领域的一个标准，但是应用transformer到CV领域效果还是很有限的。在视觉领域，自注意力要么和卷积神经网络一起使用，要么是将卷…

人工智能 2023年7月28日
0067
目标检测——Faster RCNN

Faster RCNN是由 R-CNN、Fast R-CNN 改进而来，是非常经典的目标检测的两阶段网络。此篇博客是我通过学习以下优秀博客归纳整理而得：一文读懂Faster R…

人工智能 2023年6月17日
00103
快速解决“多分类不平衡”问题

在机器学习中，经常会遇到分类不平衡问题。简单来说，就是多分类时有的类别数量少，会影响整体模型的准确率。目录前言一、问题详细描述 1.项目介绍 2.调参尝试二、分析原因 1….

人工智能 2023年7月28日
0064
聚类算法学习

聚类 K-means 法 * 基本思想 Matlab代码最大最小距离法 * 基本思想 Matlab代码测试结果比较 K-means 法基本思想此处把数据中每一…

人工智能 2023年5月31日
0083
计算机视觉教程2-6：八大图像特效算法制作你的专属滤镜(附Python代码)

目录 0 写在前面 1 毛玻璃特效 2 浮雕特效 3 油画特效 4 马赛克特效 5 素描特效 6 怀旧特效 7 流年特效 8 卡通特效 0 写在前面图像特效处理是基于图像像素数据…

人工智能 2023年6月23日
00103
Python中print()函数的几种输出形式，含标准化输出

在python中print()函数输出字符加变量有很多种形式，本文做一个整理！假设我们要输出的句子是：张三的年龄是20岁，收入为1万元每月。其中张三，20，1是变量。 name…

人工智能 2023年7月4日
00102
AI实战：用Transformer建立数值时间序列预测模型开源代码汇总

Transformer是一个利用注意力机制来提高模型训练速度的模型。，trasnformer可以说是完全基于自注意力机制的一个深度学习模型，因为它适用于并行化计算，和它本身模型的复…

人工智能 2023年6月23日
0094
嗷~~~润

文章目录 * – 前言 – 开机设置 – USB Type C联网 – 10G以太网口静态IP设置 – apt 和 py…

人工智能 2023年6月10日
00101
Matlab作图后的各种调整方法——线条、坐标、标题、图例

Matlab作图后的各种调整方法——线条、坐标、标题、图例文章目录 Matlab作图后的各种调整方法——线条、坐标、标题、图例一，写在前面 * 1.整个图窗 Figure（…

人工智能 2023年6月17日
0077
linux配tensorflow-gpu：步步避坑+常见报错处理

目录 1. 更新电脑显卡驱动 2. 更改gcc和g++版本 3. 安装CUDA 4. 安装cuDNN 5. 最后安装Tensorflow-gpu 参考资料我用的是ubuntu18…

人工智能 2023年5月23日
00125

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

使用 OpenCV 收集数据

大家都在看