一、opencv详细介绍

2023年5月26日下午2:11 • 人工智能 • 阅读 81

; 一、opencv详细介绍

文章目录

一、opencv详细介绍
*
1.1 什么是opencv
1.2 opencv历史
1.3 为什么用OpenCV
1.4 opencv的应用场景
–

opencv官方资料教程地址： https://opencv.org/

1.1 什么是opencv

OpenCV是一个基于BSD许可（开源）发行的跨平台计算机视觉和机器学习软件库，可以运行在Linux、Windows、Android和Mac OS操作系统上。 它轻量级而且高效——由一系列 C 函数和C++ 类构成，同时提供了Python、Ruby、MATLAB等语言的接口，实现了图像处理和计算机视觉方面的很多通用算法。

1.2 opencv历史

1999 年，Gary Bradski（加里·布拉德斯基）当时在英特尔任职，怀着通过为计算机视觉和人工智能的从业者提供稳定的基础架构并以此来推动产业发展的美好愿景，他启动了 OpenCV 项目。

OpenCV 库用C语言和 C++ 语言编写，可以在 Windows、Linux、Mac OS X 等系统运行。同时也在积极开发 Python、Java、Matlab 以及其他一些语言的接口，将库导入安卓和 iOS 中为移动设备开发应用。

OpenCV 自项目成立以来获得了来自英特尔和谷歌的大力支持，尤其需要感谢 Itseez，该公司完成了早期开发的大部分工作。此后，Arraiy 团队加入该项目并负责维护始终开源和免费的 OpenCV.org。

Itseez 是俄罗斯的一家视觉公司，专门从事计算机视觉算法。2016 年 5 月，英特尔收购该公司，以”帮助英特尔的用户打造创新型深度学习的 CV 应用，如果自动驾驶、数字安全监控和工业检测”（英特尔物联网总经理 Doug Dacies 如此说）

1.3 为什么用OpenCV

计算机视觉市场巨大而且持续增长，且这方面没有标准API，如今的 计算机视觉软件大概有以下三种：

研究代码（慢，不稳定，独立并与其他库不兼容）
耗费很高的商业化工具（比如Halcon, MATLAB+Simulink）
依赖硬件的一些特别的解决方案（比如视频监控，制造控制系统，医疗设备）这是如今的现状，而标准的API将简化计算机视觉程序和解决方案的开发，OpenCV致力于成为这样的标准API。

OpenCV致力于真实世界的实时应用，通过优化的C代码的编写对其执行速度带来了可观的提升，并且可以通过购买 Intel的IPP高性能多媒体函数库（Integrated Performance Primitives）得到更快的处理速度。

IPPICV 加速
如果希望得到更多在英特尔架构上的自动优化，可以购买英特尔的集成性能基元（IPP）库，该库包含了许多算法领域的底层优化程序。在库安装完毕的情况下 OpenCV 在运行的时候会自动调用合适的 IPP 库。
从 OpenCV 3.0 开始，英特尔许可 OpenCV 研发团队和 OpenCV 社区拥有一个免费的 IPP 库的子库（称 IPPICV），该子库默认集成在 OpenCV 中并在运算时发挥效用。
如果你使用的是英特尔的处理器，那么 OpenCV 会自动调用 IPPICV。
IPPICV 可以在编译阶段链接到 OpenCV，这样一来，会替代相应的低级优化的C语言代码（在 cmake 中设置 WITH_IPP=ON/OFF来开启或者关闭这一功能，默认情况为开启）。使用 IPP 获得的速度提升非常可观。

1.4 opencv的应用场景

https://paperswithcode.com/sota 这个网站非常详细划分了 16 个大方向，包括总共 1081 个子方向。如果想进入机器学习领域，首先还是选择一个方向领域，然后了解和熟悉该方向领域内所需要的算法，特定的解决技巧等。

计算机视觉可以分为以下几大方向：图像识别、目标检测、图像分割、风格迁移、图像重构、超分辨率、图像生成、人脸识别、其他。

1、图像分类

(Image Classification)：也称图像识别，就是辨别图像是什么，或者说图像中的物体属于什么类别。

图像分类根据不同分类标准可以划分为很多种子方向；比如根据类别标签，可以划分为

二分类问题：比如判断图片中是否包含人脸；
多分类问题：比如鸟类识别；
多标签分类，每个类别都包含多种属性的标签：比如对于服饰分类，可以加上衣服颜色、纹理、袖长等标签，输出的不只是单一的类别，还可以包括多个属性。

2、目标检测

(Object Detection)：目标检测通常包含两方面的工作，首先是找到目标，然后就是识别目标。

目标检测可以分为单物体检测和多物体检测，即图像中目标的数量，例子如下所示：

; 3、图像分割

(Object Segmentation)：图像分割是基于图像检测的，需要检测到目标物体，然后把物体分割出来。

图像分割可以分为三种：

普通分割：将不同分属于不同物体的像素区域分开，比如前景区域和后景区域的分割；
语义分割：普通分割的基础上，在像素级别上的分类，属于同一类的像素都要被归为一类，比如分割出不同类别的物体；
实例分割：语义分割的基础上，分割出每个实例物体，比如对图片中的多只狗都分割出来，识别出来它们是不同的个体，不仅仅是属于哪个类别。

一个图形分割的例子如下所示，下图就是一个实例分割的例子，用不同的颜色表示不同的实例

4、风格迁移

(Style Transfer)：风格迁移是指将一个领域或者几张图片的风格应用到其他领域或者图片上。比如将抽象派的风格应用到写实派的图片上。

一个风格迁移的例子如下, 图 A 是原图，后面的 B-D 三幅图都是根据不同风格得到的结果

; 5、图像重构

(Image Reconstruction)：也称为图像修复(Image Inpainting)，其目的就是修复图像中缺失的地方，比如可以用于修复一些老的有损坏的黑白照片和影片。通常会采用常用的数据集，然后人为制造图片中需要修复的地方。

一个修复的例子如下所示，总共是四张需要修复的图片

6、超分辨率

(Super-Resolution)：超分辨率是指生成一个比原图分辨率更高、细节更清晰的任务。一个例子如下图所示

通常超分辨率的模型也可以用于解决图像恢复(image restoration)和修复(inpainting)，因为它们都是解决比较关联的问题。

; 7、图像生成

(Image Synthesis)：图像生成是根据一张图片生成修改部分区域的图片或者是全新的图片的任务。这个应用最近几年快速发展，主要原因也是由于 GANs 是最近几年非常热门的研究方向，而图像生成就是 GANs 的一大应用。

一个图像生成例子如下：

8、人脸识别

人脸方面的应用，包括人脸识别、人脸检测、人脸匹配、人脸对齐等等，这应该是计算机视觉方面最热门也是发展最成熟的应用，而且已经比较广泛的应用在各种安全、身份认证等，比如人脸支付、人脸解锁。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-1MZGE96D-1638193524522)(opencv图像处理（c++）/1604244708687.png)]

9、其他

opencv实际上还有其他很多方向应用，包括：

图文生成(Image Captioning)：给图片生成一段描述。
文本生成图片(Text to Image)：基于文本来生成图片。
图片上色(Image Colorization)：将图片从黑白变为彩色图。
人体姿态估计(human pose estimation)：识别人的行为动作
还有包括 3D、视频、医学图像、问答、自动驾驶、追踪等等方向

Original: https://blog.csdn.net/qq_34029954/article/details/121620494
Author: bug设计工程师
Title: 一、opencv详细介绍

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/519989/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Mybatis-Plus 使用技巧与隐患

回答1：是基于的增强工具包，实现了在中的增删改查等操作的一系列便捷功能，同时还提供了代码自动生成、性能优化等功能。可以大大简化操作的代码量,同时提供了更多的查询方式，例如…

人工智能 2023年6月27日
0074
AI遮天传 DL-深度学习在计算机视觉中的应用

本文只做一些在计算机视觉中应用的简单介绍，童叟无欺。一、图像分类 a. 通用图像分类将不同图片按照内容进行分类 b. 特定图像分类特定识别人脸、某种动物、汽车等 1.1 人脸…

人工智能 2023年6月16日
0067
论文复现——CE-FPN: Enhancing Channel Information for Object Detection

最近想自己对FPN结构进行一些改进，读了不少有关FPN的论文，有些论文开源了，但是有些最新的论文没有开源，后面打算把最近复现的论文都总结一下，发个论文复现系列的文章。 &#…

人工智能 2023年6月24日
0060
基于图像处理的类的继承学习

; Filter基类 class Filter: def __init__(self,image,para): self.image = image self.para = par…

人工智能 2023年6月22日
0048
2-4 经典机器学习算法-K近邻算法KNN，KNN与K-means之间的区别和联系，KNN平衡方差和偏差，Python实现KNN

1、什么是K近邻算法(K-NN)? 2、K-NN与K-means之间有什么区别和联系？3、在K-NN算法中如何平衡方差和偏差？4、在K-NN算法中如何选择K值的大小？5、请用Pyt…

人工智能 2023年6月2日
0060
目标检测模型从训练到部署！

Datawhale干货作者：张强，Datawhale成员训练目标检测模型并部署到你的嵌入式设备，让边缘设备长”眼睛”。目标检测的任务是找出图像中所有感…

人工智能 2023年7月10日
0059
聚类算法之DBSCAN

DBSCAN聚类算法 1. DBSCAN算法基本概念 DBSCAN是一种典型的基于密度的聚类算法，基于一组邻域( ϵ , M i n P t s ) (\epsilon, MinP…

人工智能 2023年5月31日
0047
基础排序算法(附加java实现)

七种最基本的排序算法：（面试必会！）冒泡排序：最基础的排序算法，从数列最前端开始，两两比较，如果前一个数比后一个数大，那么两个数就交换位置，经过一轮遍历之后，最大的数就到了数列…

人工智能 2023年6月4日
0080
WSDM 2022 推荐系统论文阅读（下）

本篇是WSDM 2022中推荐系统论文阅读的完结篇！声明：本论文阅读笔记主要是对论文摘要的概括，评论仅代表个人的阅读观点，欢迎大家在评论区讨论！公司/学校：汉阳大学（韩国）摘…

人工智能 2023年6月10日
0069
MMdetection训练自己的数据集（win10）

一、准备数据集 mmdetection默认使用coco数据集，这里我的原始数据集为PascalVOC格式，先进行数据集转换。各种数据转换项目里边都有现成的代码。 cmd到D:\mm…

人工智能 2023年7月9日
0052
R数据分析：数据清洗的思路和核心函数介绍

好多同学把统计和数据清洗搞混，直接把原始数据发给我，做个统计吧，这个时候其实很大的工作量是在数据清洗和处理上，如果数据很杂乱，清洗起来是很费工夫的，反而清洗好的数据做统计分析常常就…

人工智能 2023年7月16日
0057
语音识别原理与应用洪青阳第一章概论

目录第一章语音识别概论 1.1 语音的产生和感知 1.2 语音识别过程 1.3语音识别发展历史第一章语音识别概论语音识别的基础理论包括语音的产生和感知过程、语音信号基础…

人工智能 2023年5月25日
0061
基于51单片机的水箱水位监测控制系统proteus仿真原理图PCB

功能介绍：0.本系统采用STC89C52作为单片机1.通过传感器监测水位，当水位低于水位下限时，接通加水水泵，直到水位达到水位上限，停止加水2.水位低于水位下限时，声光报警3.可按…

人工智能 2023年6月28日
0068
模仿CSDN黑暗帝国动态背景的vue项目(附源码)

开发工具：Webstorm技术栈：vue、html、canvas实现步骤：（1）在这里的项目我是用VueCli3脚手架进行搭建的。（2）关于动态背景的源码则是在github找的源码…

人工智能 2023年6月28日
0070
基于Prompt-tuning实现情感分类

自去年来，prompt-tuning在NLP领域开始大放异彩，并随着刘鹏飞老师关于prompt的综述而广为人知。 Pre-train, Prompt, and Predict: A…

人工智能 2023年5月30日
00126
NeRF学习笔记(含公式、图解和过程)

NeRF学习笔记关注公众号，不定期分享NeRF相关文献。 ; 引言 NeRF: Representing Scenes as Neural Radiance Fields for…

人工智能 2023年6月24日
0098

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30