Mask RCNN算法详解（总结）

2023年5月26日上午8:55 • 人工智能 • 阅读 109

Mask RCNN:目标检测+实例分割

作用：可以完成目标分类，目标检测，语义分割，实例分割，人体姿态识别等多种任务。

1.实例分割与语义分割的区别和关系？

通常的目标分割是指语义分割，实例分割是从目标分割独立出来的一个小领域，两者相比实例分割更加复杂。
实例分割需要在语义分割的基础上对同类物体进行更加精细的分割。

2.算法主要思想
Mask rcnn算法是由faster rcnn 和语义分割算法FCN组成。前者完成目标检测任务，后者可以准确完成语义分割的任务。
主要思路：原始Faster-rcnn算法的基础上面增加了FCN来产生对应的MASK分支。
（发现了ROI Pooling中所存在的像素偏差问题，提出了对应的ROI Align策略，加上FCN精准的像素MASK，使得其可以获得高准确率。）

3.Mask R-CNN算法步骤

1.把图片输入到网络中获得对应的特征图；
2.然后把这个特征图中的每一点设定个ROI（感兴趣区域），从而获得多个候选ROI；
3.再把这些候选的ROI送入RPN网络中进行二值分类（前景或后景）和回归，过率掉一部分候选的ROI；
4.接着对这些剩下的ROI进行ROI Align操作（即先将原图和特征图的pixel对应起来，然后将特征图和固定的特征对应起来）；
5.最后，再对这些ROI进行分类（多分类）、回归（BB）和MASK生成（在每一个ROI中进行FCN操作）

4.ROI Align 详解

ROI Align与ROI Pooling区分比较：

最大区别：ROI Pooling使用了两次量化（取整）操作，但是ROI Align没有采用量化操作，而是使用了线性插值算法。

ROI Pooling 技术

1.图像坐标—-特征图坐标出现小数后，取整，第一次量化
2.特征图坐标—ROI特征坐标出现小数，取整，第二次量化，两次量化导致特征像素出现丢失和偏差。

ROI Align 技术

未引入量化操作，使用双线性插值方法来解决像素浮点数问题。
双线性插值方法：利用原图中的虚拟点四周的四个真实存在的像素值来共同决定目标图中的一个像素值，即20.56浮点数像素值的虚拟位置点对应的像素值估计出来。

4.FCN 语义分割详解

FCN算法思想：首先对图像进行卷积和池化，不断减小其feature map，然后进行反卷积操作，即进行插值操作，增大其feature map，最后对每一个像素值进行分类。

[1]参考博客https://blog.csdn.net/WZZ18191171661/article/details/79453780

Original: https://blog.csdn.net/weixin_44312422/article/details/121000465
Author: 奶茶不加冰
Title: Mask RCNN算法详解（总结）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/518930/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

数分实习踩坑笔记：Hive SQL

记录一下数分实习中踩过的坑，好记性不如烂笔头，更何况我记性差到不能行，离职后能带走的也就只有自己的笔记经验和感受。 Hive SQL篇 SQL执行顺序 from：作from子句前两…

人工智能 2023年6月11日
00107
卷积神经网络之一维卷积（笔记）

前言卷积之前在自动控制系统中接触过，当时查了资料感觉知乎的一位大佬写的笔记很好这里附上该篇文章的链接。下面我所写的是卷积神经网络中的一维卷积，其整体思想差不多。卷积的定义卷积…

人工智能 2023年7月13日
0070
机器学习中的隐变量/潜变量和隐藏空间/潜在空间

机器学习中的隐变量/潜变量和隐藏空间/潜在空间 * – 1.什么是隐变量？ – 1.什么是潜在空间（Latent Space）？ – 2.机器学…

人工智能 2023年6月13日
0092
PaddleOCR文字检测、标注与识别详细记录

PP-OCR文字检测与识别一、配置Paddle环境创建虚拟环境 conda create –name pp python=3.7 创建完成后激活环境 conda activa…

人工智能 2023年6月24日
00219
Python 计算机视觉（十七）—— 基于KNN的图像分类

参考的一些文章以及论文我都会给大家分享出来 —— 链接就贴在原文，论文我上传到资源中去，大家可以免费下载学习，如果当天资源区找不到论文，那就等等，可能正在审核，审核完后就可以下载了…

人工智能 2023年7月28日
0085
【目标检测】从原理到实践，深度掌握YOLO系列算法！

YOLO系列算法 “You Only Look Once” 是目标检测当前最经典的算法把目标检测问题简化成了一个回归问题真可谓是 “简单易上…

人工智能 2023年7月10日
0059
批量查询搜狗收录，查询结果不准是什么原因

网站的收录情况是常用的技术手段，会影响到网站的流量和展现量，想要获得一个好的收录就必须重视原创内容，因为网站的收录直接影响力搜索引擎的关键词排名。网站收录信息如何批量查询?以搜狗收…

人工智能 2023年7月30日
0066
自动驾驶感知新范式——BEV感知经典论文总结和对比（下）

本文承接上篇：自动驾驶感知新范式——BEV感知经典论文总结和对比（上）_苹果姐的博客-CSDN博客bev感知经典论文总结和对比https://blog.csdn.net/weix…

人工智能 2023年6月17日
0064
特征点的检测与匹配（ORB,SIFT,SURFT比较）[opencv-python]

特征点的检测与匹配（ORB,SIFT,SURFT比较）本文旨在总结opencv-python上特征点的检测和匹配。1、特征点的检测（包括：ORB,SIFT,SURFT）2、特侦点…

人工智能 2023年6月19日
00165
Halcon图像拼接-算法速度优化

参考例程mosaicking_pyramid.hdev 原理简要说明：在上一篇的基础上，我们知道了在halcon中，图像拼接的大致原理，知道了算法运行的过程，其中一个关键步骤至关重…

人工智能 2023年7月10日
00115
200 aaaaaaaa ggggggjjjtrr

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月29日
0073
如何设置合适的anchor

基于anchor的检测方法，anchor的作用是作为GT框和分配到Feature Map(后面简称FM)的一个媒介，通过计算FM上每个grid对应的anchor和GT之间的IOU大…

人工智能 2023年6月3日
0066
《计算机视觉基础知识蓝皮书》第5篇目标检测基础

本专栏将系统性地讲解计算机视觉基础知识、包含第 1篇机器学习基础、第2篇深度学习基础、第3篇卷积神经网络、第4篇经典热门网络结构、第5篇目标检测基础、第6篇网络搭建及训练…

人工智能 2023年6月17日
0084
基于华为云ModelArts（实现垃圾分类识别）

基于华为云ModelArts（实现垃圾分类识别）目录 * – 任务简介 – 任务设计 – 任务实施 – + 任务1 购买对象存储服…

人工智能 2023年7月1日
0058
两阶段(two stage)目标检测原理详解 — RCNN

目录一、目标检测的任务二、什么是”两阶段”呢？三、两阶段算法原理（二）候选区域算法（三）边框回归（ Bounding Box Regression…

人工智能 2023年5月26日
00120
[机器学习]多视角谱聚类(Ncut matlab代码)

一、多视角多视角聚类是伴随着信息时代发展过程中人们获取信息的途径日益增加，而逐渐出现的新聚类研究方向。通过多种途径获得的数据其实是对同件事物的不同描述，如电影的图片以及音频都是对这…

人工智能 2023年6月2日
0077

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Mask RCNN算法详解（总结）

Mask RCNN:目标检测+实例分割

大家都在看