常用图像算法汇总

2023年6月20日下午3:05 • 人工智能 • 阅读 82

图1 2020年中国计算机视觉在职人员研究领域兴趣变化

2021年中国计算机视觉在学术界和产业界各领域热度排名

目标检测

常用算法：yolov3、v4、v5。

2.底层视觉与图像处理

潜在应用：由于外界环境影响，导致图像成像效果不尽人意，从而影响后续对视频图像的处理。

2.1图像超分辨率

超分辨率（Super Resolution，SR）是从给定的低分辨率(LR)图像中恢复高分辨率(HR)图像的过程，是计算机视觉的一个经典应用。

2.2图像压缩

图像压缩就是转换图像的过程，让图像占据更少的空间。很多图像如果直接存储的话或占据很大的空间，所以出现了不少编解码器，比如 JPEG 和PNG ，目的就是减少原始图像的大小。

2.3图像修复

修复指的是恢复图像损失的部分并且基于背景信息将它们重建的技术。它指的是在视觉输入的指定区域中填充缺失数据的过程。在数字世界中，它指的是应用复杂算法以替代图像数据中缺失或者损坏部分。

2.4图像去雨、去雾

雨水去除的方法试图从由雨水条纹和雨水累积（或雨水幕效应）退化的图像中恢复干净的背景场景。

图像去雾的目的是消除雾霾环境对图像质量的影响，增加图像的可视度，是图像处理和计算机视觉领域共同关切的前沿课题。

2.5图像去模糊去噪

图像的运动模糊就是一种典型的图像退化现象。图像运动模糊是指图像中的移动效果，通常会出现在长时间曝光或被拍摄物体移动太快的情况下，由于拍摄时相机与物体之间发生了相对位移,图像上就会出现运动模糊。

2.6低照度增强

在低照度环境下拍摄的图像通常能见度都很低，这些图像除了在视觉效果上降低了美感以外，还让计算机视觉的显示效果降质了。为了解决这个问题，本文提出了一种简单有效的低照度图像增强算法

3.视频理解

3.1视频分类（动作识别、场景识别）

视频分类是指给 定一个视频片段，对其中包含的内容进行分类

3.2视频动作定位

视频动作定位是在视频中定位出正在执行动作的主体并识别出动作的问题。

4.图像分割、语义分割

4.1图像分割

图像分割是指根据颜色、空间纹理、几何形状等特征把图像划分成若干个互不相交的区域，使得这些特征在同一区域内表现出一致性或相似性，而在不同区域间表现出明显的不同。

4.2 语义分割

语义分割指的是将图像中的每一个像素关联到一个类别标签上的过程，这些标签可能包括一个人、一辆车、一朵花、一件家具等

5.姿态估计

人体关键点检测（Human Keypoints Detection）又称为人体姿态估计，是计算机视觉中一个相对基础的任务，是人体动作识别、行为分析、人机交互等的前置任务。一般情况下可以将人体关键点检测细分为单人/多人关键点检测、2D/3D关键点检测，同时有算法在完成关键点检测之后还会进行关键点的跟踪，也被称为人体姿态跟踪。

6.人脸

使用Arcface人脸识别模块，在五百亚洲人底库中精度可达99%+。

7.行人重识别

行人重识别（Person Re-identification）又被称为行人再识别，如今被视为图像检索的一类关键子问题。它是利用计算机视觉算法对跨设备的行人图像或视频进行匹配，即给定一个查询图像，在不同监控设备的图像库检索出同一个行人.

8.目标跟踪

8.1单目标跟踪

对于单目标跟踪而言一般的解释都是在第一帧给出待跟踪的目标，在后续帧中，tracker能够自动找到目标并用bbox标出。

8.2多目标跟踪

多目标跟踪，即 Multiple Object Tracking (MOT)，主要任务中是给定一个图像序列，找到图像序列中运动的物体，并将不同帧的运动物体进行识别，也就是给定一个确定准确的id，当然这些物体可以是任意的，如行人、车辆、各种动物等等，而最多的研究是行人跟踪，由于人是一个非刚体的目标，且实际应用中行人检测跟踪更具有商业价值。绝大多数MOT 算法无外乎这四个步骤：①检测 ②特征提取、运动

9.文本理解

文本理解目前主要有两个方面的工作，一个是传统的文本理解，它往往只需识别文档中的文本；而另一个场景文字理解，需要将照片或视频中的文字识别出来，它包含文本检测和文本识别两个步骤：首先是对存在文字区域的定位（Text Detection），即找到单词或文本行的边界框（bounding box）；然后对定位的区域内容进行识别（Text Recognition），即预测边界框中每一个字符的类标签。将这两步合在一起就能达到最终目的：端到端的文本识别。

10.三维视觉

三维视觉作为一个学科来讲，是多学科的交叉融合。主要有计算机视觉、计算机图形学，还有人工智能。具体来讲，三维视觉涉及的研究内容，主要包括三维感知、位姿感知、三维建模、三维理解，甚至还有三维认知的方面。

11.医学图像

医学图像是反映人体内部结构的图像，是现代医疗诊断的主要依据之一。目前，医学图像处理任务主要集中在图像检测、图像分割、图像配准及图像融合四个方面。

医学图像数据具有可获得、质量高、体量大、标准统一等特点，使人工智能在其中的应用较为成熟。利用图像处理技术对图像进行分析和处理，实现对人体器官、软组织和病变体的位置检测、分割提取、三维重建和三维显示，可以对感兴趣区域（Region of Interest, ROI)进行定性甚至定量的分析，从而大大提高临床诊断的效率、准确性和可靠性，在医疗教学、手术规划、手术仿真及各种医学研究中也能起重要的辅助作用。

多模态学习

模态：每一种信息的来源或者形式，都可以称为一种模态，例如：触觉，听觉，视觉，嗅觉；信息的媒介，有语音、视频、文字；传感器，如雷达、红外、加速度计。

多模态机器学习（MultiModal Machine Learning (MMML)，旨在通过机器学习的方法实现处理和理解多源模态信息的能力。

小样本学习

Few-shot learning (FSL)在机器学习领域具有重大意义和挑战性，是否拥有从少量样本中学习和概括的能力，是将人工智能和人类智能进行区分的明显分界点，因为人类可以仅通过一个或几个示例就可以轻松地建立对新事物的认知，而机器学习算法通常需要成千上万个有监督样本来保证其泛化能力。

Original: https://blog.csdn.net/weixin_45038213/article/details/123211503
Author: weixin_45038213
Title: 常用图像算法汇总

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/641492/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【机器学习系列】【调参GridsearchCV】随机森林、GBDT、LightGBM和XGBoost调参顺序，外加一些加速调参的小技巧（主要介绍坐标下降）

本文将记录一下几个可以将模型参数分开进行调参的树形模型的调参顺序。以及几个能够加快调参速度的小技巧。如果有帮到你，帮懒羊羊点个赞，关注一下我呗。 1.GridSearchCV简介、…

人工智能 2023年6月15日
0066
机器学习中的回归问题

机器学习中的回归问题本文从机器学习的基本概念引出解决回归问题的算法及具体流程，主要介绍包含线性回归、回归树和支持向量回归这三种算法。 1 机器学习的基本概念 ; 1.1 回归案例…

人工智能 2023年6月18日
0049
人工智能基本概念

人工智能是想让机器跟人一样进行学习、理解、分析、决策等智能思想行为，会涉及到听、说、读、写、行动等方面的能力。 1、弱人工智能某一方面的人工智能，比如图像识别中的人脸识别，只能识…

人工智能 2023年5月31日
0064
RPA能否创造新业态?如何优化组织结构?如何助力疫情中的企业?

RPA能否创造新业态?如何优化组织结构?如何助力疫情中的企业? 从《爱，死亡和机器人》探讨强人工智能时代的RPA发展文/王吉伟本周四，王吉伟频道参加了私域流量社群的一个直播活动…

人工智能 2023年6月4日
0091
图像处理(7) : 边缘检测

边缘检测是图形图像处理、计算机视觉和机器视觉中的一个基本工具，通常用于特征提取和特征检测，旨在检测一张数字图像中有明显变化的边缘或者不连续的区域，在一维空间中，类似的操作被称作步长…

人工智能 2023年6月17日
0063
【PaddleDetection报错】IndexError: Target xxx is out of bounds.

目录前言问题发现解决后记前言环境CUDA 11.4CUDNN 8.2windows10python3.8–>anaconda3 2021.5 作为深度…

人工智能 2023年7月28日
0049
存储mybatis的xml标签，动态sql 查询

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月29日
0060
解决Error(s) in loading state_dict for *** :

完整报错信息是：Missing key(s) in state_dict:Unexpected key(s) in state_dict：如下图所示：可以利用debug来解决。使用…

人工智能 2023年7月23日
00121
filterin

问题介绍本问题涉及”filtering”（滤波）的概念和方法，滤波是一种信号处理技术，用于从输入信号中去除干扰或者使信号更易于分析。本文将介绍一种常见的滤…

人工智能 2024年1月5日
0035
机器学习KNN（K近邻）算法及其基本原理介绍

本篇文章将为大家介绍KNN算法的基本原理，包括算法的基本流程、关键点及优缺点介绍，本篇没有任何代码，纯掰扯理论。一、什么是KNN KNN(K-Nearest Neighbor)，…

人工智能 2023年7月1日
0082
MobileNet V3(2019)

创新点 1.引入SE结构 MobileNetV3 的另一个新颖想法是在核心架构中加入一种名为「Squeeze-and-Excitation」的神经网络（简称 SE-Net，也是 …

人工智能 2023年7月14日
0059
转置卷积（Transposed Convolution）

文章目录前言卷积操作转置卷积操作 Pytorch中的转置卷积参数 Pytorch转置卷积实验前言转置卷积（Transposed Convolution）在语义分割或者对…

人工智能 2023年7月20日
0084
Python数据库编程之pymysql详解

文章目录前言一、pymsql的安装二、连接数据库三、创建和管理数据库四、创建和管理表总结前言学习之前务必安装MySQL并已启动相关服务，MySQL安装方法及查看初始…

人工智能 2023年7月4日
0053
ssb门限_画出滤波法ssb信号调制器模型，并说明低通和高通滤波器分别得到哪个边带信号…

匿名用户 2016-05-25 回答如果输出已调信号的频谱和输入调制信号的频谱之间满足线性搬移关系，则称为线性调制，通常也称为幅度调制。线性调制的主要特征是调制前后的信号频谱从形…

人工智能 2023年5月27日
0061
基于ResNet50做图片分类的tensorflow代码实现

目标任务：将数据集中5类美食图片进行分类，每一类有1000张图片，共5000张。实验总结：刚开始设置训练集和验证集的比例为8:2，有些欠拟合，因此后来调整到了9:1；分别测试了原…

人工智能 2023年7月14日
0075
机器学习—模型选择与优化7-2（网格搜索优化）

404. 抱歉，您访问的资源不存在。可能是网址有误，或者对应的内容被删除，或者处于私有状态。代码改变世界，联系邮箱 contact@cnblogs.com 园子的商业化努力-困…

人工智能 2023年6月4日
0077

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30