视觉SLAM十四讲笔记-2

2023年6月10日下午11:52 • 人工智能 • 阅读 62

视觉SLAM十四讲笔记-2

文章目录

视觉SLAM十四讲笔记-2
*
第二讲-初识SLAM
–

第二讲-初识SLAM

直接截取高翔视觉SLAM第二章开头图片：

; 2.1 引子

一个机器人要进行自主运动，首先需要感知周围的环境，需要完成两件事情：
1.我在什么地方?定位
2.周围环境是什么样?建图
定位和建图可以看做是建图的”内外之分”。一方面需要明白自身的状态(位置)，另一方面也要了解外在的环境(即地图)。
传感器：
1.安装在机器人上
轮式编码器：测量轮子转动的角度
IMU：测量运动的角速度和加速度
相机，激光传感器
2.安装在环境中
导轨，二维码标志等等，受到环境限制可能无法使用
相机：按照工作方式的不同，相机分为单目、双目、深度相机。
1.单目相机:
构造简单成本低。
只使用一个摄像头进行SLAM的做法称为单目SLAM。
特点：单目相机拍摄的图像只是三维空间的二维投影，不知道深度。所以，如果想要恢复三维结构，必须改变相机视角。必须移动相机，才能估计相机的运动，同时估计场景中的远近和大小，不妨称之为结构。
单目SLAM估计的轨迹和地图将与真实的轨迹和地图相差一个因子，也就是所谓的尺度。由于单目SLAM无法仅凭图像确定这个真实尺度，称为尺度不确定性。
2.双目相机和深度相机：
使用双目相机和深度相机的目的是通过某种手段测量物体与相机之间的距离，克服单目相机无法知道距离的特点。一旦知道了距离，场景的三维结构就可以通过单个图像恢复，同时消除尺度不确定性。双目相机由两个单目相机组成，但这个相机之间的距离(称为基线)是已知的。通过这个基线来估计每个像素的空间位置。(基线距离越大，能够测量到的物体就越远，并且计算量是双目的主要问题之一)
深度相机(又称RGB-D相机)，它最大的特点是可以通过红外结构光或Time-of-Filght(ToF)原理，激光传感器通过主动向物体发射光并接收返回的光，测出物体与相机之间的距离。通过物理测量手段，相比于双目相机计算来说可以节省计算资源。
现在多数RGB-D相机存在测量范围窄、噪声视野小、易受日光干扰、无法测量透射材质等诸多问题，在SLAM方面，主要用于室内，室外较难应用。

2.2 经典视觉SLAM框架

整个SLAM流程框架如图所示。

整个视觉SLAM包括以下几个步骤：
1.传感器信息读取。视觉SLAM中主要是相机图像信息的读取和预处理，如果是机器人中可能有码盘、惯性传感器的读取和同步。
2.前端视觉里程计。视觉里程计的任务是估计相邻图像间相机的运动，以及局部地图的样子。
3.后端(非线性优化)。后端接受不同时刻视觉里程计测量的相机位姿，以及回环检测的信息，对它们进行优化，得到全局一致的轨迹和地图。
4.回环检测。判断机器人是否到达先前的位置。如果检测到回环，会把消息提供给后端进行处理。
5.建图。根据估计的轨迹，建立与任务对应的地图。

; 2.2.1 视觉里程计

视觉里程计关心相邻图像之间的相机运动，
在计算机视觉领域，图像在计算机里只是一个数值矩阵。在视觉SLAM中，只能看到一个个像素，知道它们是某些空间点在相机的成像平面上投影的结果。所以，为了定量地估计相机运动，必须先了解相机与空间点的几何关系。
假设已经有了一个视觉里程计，估计了两张图像间的相机运动。那么，一方面只要把相邻时刻的运动串起来就可以构成了机器人的运动轨迹，从而解决了定位问题。另一方面，根据每一时刻的相机位置，计算出各像素对应的空间点位置，就得到了地图。由此看来，视觉里程计是SLAM的关键。
然而，视觉里程计会出现累积漂移。为了解决漂移问题，需要：后端优化和回环检测。

2.2.2 后端优化

后端有话主要指处理SLAM过程中的噪声问题。现实过程中，再精确的传感器也会有一定的噪声，除了解决”如何从图像中估计出相机运动”，还要关系这个估计带有多大的噪声。 后端优化要解决的问题就是如何从这些带有噪声的数据中估计整个系统的状态，以及这个状态估计的不确定性有多大。
后端，负责整体的优化过程，往往面对的只有数据，不必关心这些数据到底来自什么传感器。
后端主要是滤波与非线性优化算法

2.2.3 回环检测

主要解决位置估计随时间漂移的问题。
为了实现回环检测，需要机器人具有识别到过场景的能力。

2.2.4 建图

分为度量地图和拓扑地图

2.3 SLAM问题的数学表述

把一段连续时间的运动变成了离散时刻 t = 1 , 2 , 3 , … , K t=1,2,3,…,K t =1 ,2 ,3 ,…,K，在这些时刻，用x x x表示每一时刻机器人的位置，于是每一时刻的位置记为x 1 , x 2 , . . . , x K x_{1},x_{2},…,x_{K}x 1 ,x 2 ,…,x K 。实际环境中存在许多路标，每一时刻，传感器会测量得到一部分路标点，得到它们的观测数据。不妨设路标点一共有 N N N个，用 y 1 , y 2 , . . . , y N y_{1},y_{2},…,y_{N}y 1 ,y 2 ,…,y N 表示它们。
根据上面的定义，机器人在环境中的运动，可以由下面两件事情描述：
1.运动。要考察从 k − 1 k-1 k −1时刻到 k k k时刻，机器人的位置 x x x是如何变化的。
2.观测。在 k k k 时刻于 x k x_{k}x k 处探测到了某一个路标 y j y_{j}y j
数学模型：
x k = f ( x k − 1 , u k , w k ) x_{k} = f(x_{k-1},u_{k},w_{k})x k =f (x k −1 ,u k ,w k )
u k u_{k}u k 为运动传感器的输入，w k w_{k}w k 为该过程中加入的噪声。上式表示为运动方程。
由于噪声的存在，如果只根据运动传感器的指令来确定位置可能会与实际位置相差很大。因此，与运动方程相对应，还有一个观测方程。当机器人在 x k x_{k}x k 位置上看到某个路标点 y j y_{j}y j 时，产生一个观测数据 z k , j z_{k,j}z k ,j 。同样，用一个抽象的函数 h h h 来描述这个关系：
z k , j = h ( y j , x k , v k , j ) z_{k,j} = h(y_{j}, x_{k}, v_{k,j})z k ,j =h (y j ,x k ,v k ,j )
v k , j v_{k,j}v k ,j 为这次观测里的噪声。
因此，SLAM过程可以总结为两个基本方程：
{ x k = f ( x k − 1 , u k , w k ) k = 1 , . . . , K z k , j = h ( y j , x k , v k , j ) , ( k , j ) ∈ O \left{ \begin{array}{c} x_{k} = f(x_{k-1},u_{k},w_{k}) k=1,…,K\ z_{k,j} = h(y_{j}, x_{k}, v_{k,j}), (k,j)\in O \ \end{array}\right.{x k =f (x k −1 ,u k ,w k )k =1 ,…,K z k ,j =h (y j ,x k ,v k ,j ),(k ,j )∈O
可以参考下图：link

这两个方程描述了最基本的SLAM问题，当知道运动测量的读数 u u u，以及传感器的读数 z z z时，如何求解定位问题(估计 x x x)和建图问题(估计 y y y)？把SLAM问题建模成一个状态估计问题：如何通过带有噪声的测量数据，估计内部的、隐藏着的状态变量。
求解方法
目前，主流视觉SLAM使用以图优化为代表的优化技术进行状态估计。

Original: https://blog.csdn.net/qq_35588369/article/details/124210580
Author: 四夕小一冰
Title: 视觉SLAM十四讲笔记-2

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/598147/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

R语言学习笔记 ①绘制直方图 histogram

以作业为例要求：Copy and Paste Your R Output From the R Script (or the output of Excel) 步骤：首先打开R…

人工智能 2023年7月14日
00137
基于多输入模型及句法结构的中文评论情感分析方法

点击上方蓝字关注我们基于多输入模型及句法结构的中文评论情感分析方法张宝华1, 张华平1, 厉铁帅2, 商建云1 1 北京理工大学计算机学院，北京 100081 2 中央军事委员…

人工智能 2023年5月30日
0074
Python 计算机视觉（十）—— OpenCV 图像锐化及边缘检测

参考的一些文章以及论文我都会给大家分享出来 —— 链接就贴在原文，论文我上传到资源中去，大家可以免费下载学习，如果当天资源区找不到论文，那就等等，可能正在审核，审核完后就可以下载了…

人工智能 2023年5月26日
0070
学习笔记15–车道线检测

本系列博客包括6个专栏，分别为：《自动驾驶技术概览》、《自动驾驶汽车平台技术基础》、《自动驾驶汽车定位技术》、《自动驾驶汽车环境感知》、《自动驾驶汽车决策与控制》、《自动驾驶系统设…

人工智能 2023年7月27日
0053
基于ASP.NET CORE MVC 3.1 打造百度AI智能体验平台：从人脸/手势识别到语音识别控制

前言停更太久了，倒也不是多忙，主要是学习的热情降低了，又比较懒，因此，即使有做出新的玩意或者有所收获，也懒得去码字。最近做了一个百度AI的web端玩具，可以人脸识别/注册/颜值打…

人工智能 2023年5月27日
00111
Ubuntu查看cuDNN版本

1、先成功下载cuDNN(如果这个有问题的，请参考我的另一个博客，地址：tensorflow2.0及以上版本用GPU加速计算_English ONly的博客-CSDN博客) 2、将…

人工智能 2023年5月25日
0074
关于光流法cv::calcOpticalFlowPyrLK的学习使用记录-参数的分析以及方法使用的思考

文章目录前言一、calcOpticalFlowPyrLK 源代码二、calcOpticalFlowPyrLK opencv自带参数说明 * 1.英文原话 2.Google翻译…

人工智能 2023年7月19日
0048
逻辑回归模型在处理大规模数据时会遇到什么问题

问题描述在处理大规模数据时，逻辑回归模型可能会遇到一些问题。本文将详细介绍逻辑回归算法的原理和公式推导，并给出计算步骤和复杂的Python代码示例。我们将使用虚拟数据集进行演示。…

人工智能 2023年12月31日
0040
Python足够开一家语音识别公司的中文语音识别系统源码方案

人工智能 2023年5月23日
0064
数据结构与算法刷题网站推荐

注：下面网站大致按照难度不同划分和 LeetCode 一样，但是难度低很多，适合刚刚看完书来练习北大的 OJ，传统题比较多。最出名的算法刷题网站，推荐按照对应专题一个个刷，作…

人工智能 2023年6月6日
0057
幸福指数报告 — 数据可视化+聚类分析

幸福指数报告 – 数据可视化+聚类分析背景描述《世界幸福报告》是对全球幸福状况的具有里程碑意义的调查，根据其公民对自己的幸福程度对156个国家进行了排名。《 2020年报告》…

人工智能 2023年5月31日
00109
raw图的存储格式和读取方式

前言由于在图像处理过程中经常会涉及到对各种raw图的操作，所以本文简单介绍一下经常遇到的几种格式的raw图的存储格式和读取方法。一、raw格式图 1.存储格式 raw图目前遇到…

人工智能 2023年6月17日
0064
对Transformer中Add&Norm层的理解

对Add&Norm层的理解 Add操作 Norm操作 Add操作首先我们还是先来回顾一下Transformer的结构：Transformer结构主要分为两大部分，一是En…

人工智能 2023年7月26日
0053
训练AI玩贪吃蛇(强化学习与Q-learning)

欢迎加入我们卧虎藏龙的python讨论qq群：729683466 ● 导语 ● AI近些年发展很火不但可以下围棋还可以玩各种各样的游戏国外有人构建AI模型然后训练出了非常…

人工智能 2023年6月25日
0056
应用实践：Paddle分类模型大集成者[PaddleHub、Finetune、prompt]

NLP专栏简介：数据增强、智能标注、意图识别算法|多分类算法、文本信息抽取、多模态信息抽取、可解释性分析、性能调优、模型压缩算法等专栏详细介绍：NLP专栏简介：数据增强、智能标注…

人工智能 2023年6月19日
0080
利用python实现Apriori关联规则算法

关联规则大家可能听说过用于宣传数据挖掘的一个案例:啤酒和尿布；据说是沃尔玛超市在分析顾客的购买记录时，发现许多客户购买啤酒的同时也会购买婴儿尿布，于是超市调整了啤酒和尿布的货架摆…

人工智能 2023年7月25日
0045

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

视觉SLAM十四讲笔记-2

文章目录

第二讲-初识SLAM

; 2.1 引子

2.2 经典视觉SLAM框架

; 2.2.1 视觉里程计

2.2.2 后端优化

2.2.3 回环检测

2.2.4 建图

2.3 SLAM问题的数学表述

大家都在看