(ICCV 19) Deep Closest Point: Learning Representations for Point Cloud Registration

2023年5月28日上午2:08 • 人工智能 • 阅读 106

(ICCV 19) Deep Closest Point: Learning Representations for Point Cloud Registration

Deeo Closest Point（DCP[1]）可以算是小数据集ModelNet40上使用深度学习做配准的开山之作了，首先呈现整体模型架构图：

总体来说，DCP模型主要由4个部分构成：
1. 初始特征生成（Initial Feature Embedding）
2. 注意力机制模块（Attention）
3. 虚拟点对匹配关系生成（Pointer Generation）
4. SVD求解位姿变换
下面按照这几个模块的顺序依次进行分析：

; Network

Initial Feature Embedding
对于输入的X X X（source）与Y Y Y（target）点云，首先使用DGCNN[2]架构或者PointNet[3]进行特征提取Feature Embedding，给点云中的所有点生成一个初始的逐点特征，即：
X → D G C N N F X , Y → D G C N N F Y X\mathop \to \limits^{DGCNN} {F_X},Y\mathop \to \limits^{DGCNN} {F_Y}X →D G C N N F X ,Y →D G C N N F Y
Attention
由于以上Feature Embeddings F X , F Y {F_X},{F_Y}F X ,F Y 的计算是相互独立的，即F X {F_X}F X 与F Y {F_Y}F Y 是没有任何交互的，因此进一步为了使两点云的特征能够进行相互感知，DCP使用Attention模块以进行信息交互：

ϕ ( ⋅ ) \phi ( \cdot )ϕ(⋅)即transformer操作，可以看出，上式相当于对F X {F_X}F X 与F X {F_X}F X 多加了一个信息余项（residual term）ϕ ( ⋅ ) \phi ( \cdot )ϕ(⋅).

经过以上操作，ϕ X , ϕ Y {\phi _X},{\phi _Y}ϕX ,ϕY 为新的X X X与Y Y Y的逐点特征。
3. Pointer Generation
经过以上的Feature Embedding操作，接着给点云X X X中的每一个点，利用点云Y Y Y，生成匹配点对correspondences. 例如对x i ∈ X {x_i} \in X x i ∈X，生成一个点y ^ i {\hat y_i}y ^i 与之形成匹配对关系：

可以看到，y ^ i {\hat y_i}y ^i 的形成相当于对点云Y Y Y中的所有点进行加权求和，即利用点云Y Y Y生成一个对应匹配点，而权重由以下式子生成：

可以看到，即使用x i {x_i}x i 的feature与点云Y Y Y的feature做了一个向量内积，接着softmax成概率。
利用以上公式，即可对点云X X X中的所有点x i {x_i}x i 生成一个correspondence y ^ i {\hat y_i}y ^i .

SVD Pose Estimation
利用以上得到的点对对应关系：x i ↔ y ^ i {x_i} \leftrightarrow {\hat y_i}x i ↔y ^i
利用SVD进行位姿求解，这里文章提到传统SVD是不可微的，因此使用[4]中的SVD，以便于梯度反向传播。

Loss & Supervision

这里使用的loss比较直接，使用gt进行监督即可：

正则项为了减少模型的复杂程度。

; Experiment

ModelNet40共由40个label下的12311个点云（2048 points）所组成，作者在DCP中将9843/2468个点云划分为训练及测试集。一共进行了三组测试：

Full Dataset Train & Test （9840/2468 for training/testing）
第一组实验是在全类别下进行，在40个labels下的训练集（大小为9840）下进行网络训练，在测试集（大小为2468）上进行测试，目的是检测DCP在unseen point clouds上的配准效果：

DCP_v2commentrot_MSErot_RMSErot_MAEtrans_MSEtrans_RMSEtrans_MAEpapers1.3073291.1433850.7705730.0000030.0017860.001195dcp_v2.t7provided by author1.2175471.1034250.7502430.0000030.0016960.001170model.best.t7batch_size = 32 GPU = 3 EPOCH=25029.5637115.4372523.5306270.0001770.0133010.009703

Category Split（unseen categories）（5112/1266 for training/testing）
第二组实验的目的是测试DCP在unseen categories上的配准效果，因此训练集只包括前20个label（大小为5112），测试集只包括后20个label（大小为1266）

DCP_v2commentrot_MSErot_RMSErot_MAEtrans_MSEtrans_RMSEtrans_MAEpapers9.9237013.1501912.0072100.0000250.0050390.003703unseen-clean.t7provided in this
issue

10.9856203.3144562.1532360.0000350.0059310.004376

由于时间久远，之前训练保存的模型已找不到，因此这里并没有在unseen categories这个设定下重新训练，这里只evaluate了RPMNet[4]作者在this issue中提供的权重。

Resilience to Noise（9840/2468 for training/testing）
第三组实验目的是测试DCP在噪声扰动下的配准效果，使用第一组实验（即在无噪声添加下训练）得到的权重，在添加噪声下的测试集上进行评估

DCP_v2commentrot_MSErot_RMSErot_MAEtrans_MSEtrans_RMSEtrans_MAEpapers1.1693841.0813800.7374790.0000020.0015000.001053dcp_v2.t7provided by author1.1633211.0785730.7325670.0000020.0015050.001056model.best.t7batch_size = 32 GPU = 3 EPOCH=25030.1589205.4917143.5823760.0001750.0132140.009648

Analysis

从复现结果里来看，在setting-1与setting-3下效果都比较差，这里很奇怪，由于DCP的默认batch size = 32，而这在12G显存的显卡上单卡是训不起来的，因此用的是3卡同时训练，但得到的效果并没有文章中的结果那么好，这里作者也提到small batch size可能训不出一个好的结果，也许作者的模型是使用一个大batch size在单卡上训练得到的，这里由于硬件限制就没有继续做实验去探究。
另外关于如何训练得到DCP的pretrained model在这个issue中也提到了一些问题，感觉DCP难以复现的问题并不是一个个例。

Reference

[1] Wang Y, Solomon J M. Deep closest point: Learning representations for point cloud registration[C]//Proceedings of the IEEE/CVF International Conference on Computer Vision. 2019: 3523-3532.

[2] Wang Y, Sun Y, Liu Z, et al. Dynamic graph cnn for learning on point clouds[J]. Acm Transactions On Graphics (tog), 2019, 38(5): 1-12.

[3] Qi C R, Su H, Mo K, et al. Pointnet: Deep learning on point sets for 3d classification and segmentation[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2017: 652-660.

[4] Yew Z J, Lee G H. Rpm-net: Robust point matching using learned features[C]//Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. 2020: 11824-11833.

Original: https://blog.csdn.net/dloading7/article/details/122788899
Author: dloading7
Title: (ICCV 19) Deep Closest Point: Learning Representations for Point Cloud Registration

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/528720/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

ubuntu18.04安装pytorch、cuda、cudnn和miniconda

目录 0. 前言 1. nvidia驱动安装及卸载 1.1 安装 1.2 卸载 2. cuda-10.2安装验证及卸载 2.1 安装 2.2 验证 2.3 卸载 3. cudnn安…

人工智能 2023年7月23日
0093
【globlal与nonlocal和闭包函数、装饰器、语法糖】

🤵‍♂️ 个人主页@老虎也淘气个人主页✍🏻作者简介：Python学习者🐋 希望大家多多支持我们一起进步！😄如果文章对你有帮助的话，欢迎评论 💬点赞👍🏻 收藏 📂加关注 Pytho…

人工智能 2023年6月26日
00111
ELK集群安装

ELK集群安装一、Elasticsearch * 1.1 下载压缩包 1.2 修改/etc/sysctl.conf 1.3 生成证书 1.4 elasticsearch.yml …

人工智能 2023年6月29日
00123
pytorch 搭建AlexNet 对花进行分类

目录 1. 介绍 2. 搭建AlexNet网络 3. 准备数据集 4. 训练网络 5. 预测图片 6. code 文章内容参考：霹雳吧啦Wz 的视频教程代码的讲解可以参考之前的文章…

人工智能 2023年7月3日
0091
STM32F103在CubeIDE运行FreeRTOS

STM32F103在CubeIDE运行FreeRTOS 硬件平台：STM32F103CT6软件平台：CubeIDE 1.8.0实现效果：创建两个TASK，TASK1中实现500ms…

人工智能 2023年6月29日
0097
FPGA图像处理（一）：边缘检测

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月23日
0095
深度学习-训练模型

训练模型深度学习技术能很好的解决物体识别能力泛化的问题。但是从头开始设计、实现、训练和验证模型，是一个非常耗时耗力的工作。那么tensorflow object detection…

人工智能 2023年5月25日
0077
一种基于信息评价的强化学习方法

About ===== 一种基于信息评价的强化学习方法摘要因果关系学习一直是人工智能领域的里程碑式的挑战。人类可以通过直觉，在没有明确指导的情况下，很简单地推断出不同元素之间的…

人工智能 2023年6月1日
0083
树莓派4B安装tensorflow2.1和keras2.3.1

树莓派4B安装tensorflow2.1和keras2.3.1 最近入手了一块树莓派4B，运行内存为8GB（反正是老师出钱，要买就买顶配）。准备在树莓派上运行一下神经网络程序。此神…

人工智能 2023年5月26日
0078
对神经网络分类行为的认识二则

分类与自旋 “每一种粒子都具有一个固定的自旋值,永远不变,粒子从来不存在开始转得更快或更慢;以ћ作为度量单位, 宇宙中每个光子的自旋等于每个希格斯玻色子的自旋等于零;自…

人工智能 2023年7月1日
0084
R语言基于日期范围筛选数据实战（Subset by a Date Range）:日期范围之内的数据、日期范围之外的数据、日期之后的数据、日期之前的数据

R语言基于日期范围筛选数据实战（Subset by a Date Range）:日期范围之内的数据、日期范围之外的数据、日期之后的数据、日期之前的数据目录 R语言基于日期范围筛选…

人工智能 2023年7月18日
0064
边境的悍匪—机器学习实战：第九章无监督学习任务

第九章无监督学习任务文章目录第九章无监督学习任务前言一、思维导图二、主要内容 * 1、聚类 2、高斯混合模型三、课后练习四、总结前言 [TencentCloud…

人工智能 2023年6月2日
0099
linux安装tensorflow-gpu

目录 * – 1. 安装Anaconda – + 1.1 选择anaconda版本 + 1.2 上传到远程linux服务器（可选） + 1.3 开始进行安装…

人工智能 2023年5月25日
0099
如何划分机器学习的训练集和测试集

使用机器学习算法时，通常需要把数据分为训练集和测试集，本文介绍R语言的三种实现方法，并通过示例进行学习。使用R内置方法依据sample函数生成指定概率的true和false的向…

人工智能 2023年7月28日
0060
数据挖掘实验-Rstudio

数据挖掘实验-Rstudio 日期:22/4/29 Ps.孩子下载了Rstudio，打算有关R语言的实验都在Rstudio里做。任务一：数据采集、抽取、预处理例一：chengj…

人工智能 2023年7月15日
0068
SALNet: Semi-Supervised Few-Shot Text Classification with Attention-based Lexicon Construction

AAAI2021.本文考虑了低资源文本分类情境下对class对应的关键词进行扩充的问题，每个类收集一组被称为lexicon的词集，根据分类任务计算的注意力权重，并根据注意力系数对关…

人工智能 2023年7月1日
0081

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

(ICCV 19) Deep Closest Point: Learning Representations for Point Cloud Registration

; Network

Loss & Supervision

; Experiment

大家都在看