NeuS: Learning Neural Implicit Surfaces by Volume Rendering for Multi-view Reconstruction 论文笔记

2023年6月25日上午2:55 • 人工智能 • 阅读 43

文章目录

Related Works
方法
*
Rendering Procedure
–
Training
–
- 分层采样 Hierarchical Sampling
- 实现细节
实验
*
–
- Ablation study
- Thin structures

近来非常火热的 Neural Implicit Function：

Volume Rendering based: NeRF 结合poisson surface reconstruction (insufficient surface constraints)
Surface Rendering based: IDR(require foreground mask as supervision; trapped in local minima; struggle with reconstruction of objects with severe self-occlusion or thin structures)

NeuS 使用 SDF 函数的水平集 (zero-level set of a signed distance function (SDF)) 表示物体的表面，引入SDF导出的密度分布，采用体渲染 volume rendering 训练一个新的神经SDF表示方法。

NeuS 在复杂几何形状和自遮挡情况下都有效，取得了SOTA的效果，重建效果超过了NeRF 和 IDR，以及同期的 UNISURF。

体渲染可以处理突然的深度变化，但是重建结果的噪声较大。

NeuS: Learning Neural Implicit Surfaces by Volume Rendering for Multi-view Reconstruction 论文笔记

; Related Works

Traditional multi-view 3D reconstruction
Point- and surface-based reconstruction methods
- estimate the depth map of each pixel by exploiting inter-image photometric consistency
- then fuse the depth maps into a global dense point cloud
- the surface reconstruction is usually done as a post processing with methods like screened Poisson surface reconstruction
- the reconstruction quality heavily relies on the quality of correspondence matching, and the difficulties in matching correspondence for objects without rich textures often lead to severe artifacts and missing parts in the reconstruction results
volumetric reconstruction methods
- circumvent the difficulty of explicit correspondence matching by estimating occupancy and color in a voxel grid from multi-view images and evaluating the color consistency of each voxel
- Due to limited achievable voxel resolution, these methods cannot achieve high accuracy
Neural Implicit Representation applications
shape representation
novel view synthesis
multi-view 3D reconstruction

方法

给定物体的照片 { I k } {I_k}{I k } ，重建物体的表面 S S S。物体表面用signed distance function（SDF）表示，采用MLP编码。

Rendering Procedure

场景表示 Scene Representation

物体形状和颜色分别用SDF场，颜色场函数表示，这两个函数都采用 MLP 编码

f : R 3 → R f: \mathbb{R}^{3} \rightarrow \mathbb{R}f :R 3 →R 把空间点x ∈ R 3 \mathbf x \in \mathbb{R}^{3}x ∈R 3 映射到它距离物体的signed distance
物体的表面S S S 就用SDF的0-水平集表示：S = { x ∈ R 3 ∣ f ( x ) = 0 } S = {\mathbf x \in \mathbb{R}^{3} | f(\mathbf x)=0}S ={x ∈R 3 ∣f (x )=0 }
c : R 3 × S 2 → R 3 c: \mathbb{R}^{3} \times \mathbb{S}^{2} \rightarrow \mathbb{R}^{3}c :R 3 ×S 2 →R 3 将空间点的颜色编码成位置x ∈ R 3 \mathbf x \in \mathbb{R}^{3}x ∈R 3 和视角方向v ∈ S 2 \mathbf v \in \mathbb{S}^{2}v ∈S 2 的函数

这里引入概率密度函数 S-density： ϕ ( f ( x ) ) \phi(f(\mathbf x))ϕ(f (x )) ，其中 ϕ s ( x ) = s e − s x / ( 1 + e − s x ) 2 \phi_{s}(x)=s e^{-s x} /\left(1+e^{-s x}\right)^{2}ϕs (x )=s e −s x /(1 +e −s x )2，叫做 logistic density distribution，是 Φ s ( x ) = ( 1 + e − s x ) − 1 \Phi_{s}(x)=\left(1+e^{-s x}\right)^{-1}Φs (x )=(1 +e −s x )−1 的导数。标准差是 1 / s 1/s 1 /s，以 0 为对称轴。当网络收敛时，1/s 会逼近0。这里的概率密度函数可以用其他关于0对称的函数替代，这里是为了计算简便。

渲染 Rendering

为了学习 SDF 和颜色场的MLP参数，采用 volume rendering。

给定一个像素点，定义对应的光线 { p ( t ) = o + t v ∣ t ≥ 0 } { \mathbf p(t) = \mathbf o + t \mathbf v | t \geq 0}{p (t )=o +t v ∣t ≥0 }，o \mathbf o o 是相机中心，v \mathbf v v 是光线的单位向量，该点的颜色用积分表示为：

C ( o , v ) = ∫ 0 + ∞ w ( t ) c ( p ( t ) , v ) d t C(\mathbf{o}, \mathbf{v})=\int_{0}^{+\infty} w(t) c(\mathbf{p}(t), \mathbf{v}) \mathrm{d} t C (o ,v )=∫0 +∞w (t )c (p (t ),v )d t

其中， w ( t ) w(t)w (t )表示空间点 p ( t ) \mathbf p(t)p (t ) 在观察方向 v \mathbf v v 的权重，并且满足 w ( t ) ≥ 0 w(t) \geq 0 w (t )≥0 且 ∫ 0 + ∞ w ( t ) d t = 1 \int_{0}^{+\infty} w(t) \mathrm d t =1 ∫0 +∞w (t )d t =1 。

权重函数 weight function

训练出准确的SDF表达的关键就在于通过SDF函数 f f f 得到合适的权重函数 w ( t ) w(t)w (t ) ，w ( t ) w(t)w (t )有如下要求：

Unbiased:w ( t ) w(t)w (t ) 需要在相机光线与物体表面相交点p ( t ∗ ) \mathbf p (t^)p (t ∗) （即f ( p ( t ∗ ) ) = 0 f(\mathbf p (t^))=0 f (p (t ∗))=0）达到局部最大值。即表面附近的点对最终结果的贡献最大
Occlusion-aware: 当两个点有同样的SDF值的时候，靠近相机的点的权重应该更大。即当经过多个表面时，最靠近的表面影响最大

根据NeRF中标准的体渲染公式，权重公式定义为：

w ( t ) = T ( t ) σ ( t ) , where T ( t ) = exp ⁡ ( − ∫ 0 t σ ( u ) d u ) w(t)=T(t) \sigma(t), \quad \text{where} \ T(t) = \exp \left(-\int_{0}^{t} \sigma(u) d u\right)w (t )=T (t )σ(t ),where T (t )=exp (−∫0 t σ(u )d u )

σ ( t ) \sigma(t)σ(t ) 是 volume density 体密度，T ( t ) T(t)T (t ) 是accumulated transmittance 累积透射比，表示这一段没有击中任何粒子的概率。

Naive Solution

现在最简单的想法是把 σ ( t ) \sigma (t)σ(t ) 设为S-density，即 σ ( t ) = ϕ ( f ( p ( t ) ) ) \sigma (t) = \phi(f(\mathbf p(t)))σ(t )=ϕ(f (p (t )))。虽然是 occlusion-aware 的，但w ( t ) w(t)w (t ) 在光线到达交界点之前就达到了局部最大。

Our Solution

首先介绍直接把normalized S-density 作为权重的方法，这种方法满足unbiased，但是无法处理穿过多个表面的情况。

w ( t ) = ϕ s ( f ( p ( t ) ) ) ∫ 0 + ∞ ϕ s ( f ( p ( u ) ) ) d u w(t)=\frac{\phi_{s}(f(\mathbf{p}(t)))}{\int_{0}^{+\infty} \phi_{s}(f(\mathbf{p}(u))) \mathrm{d} u}w (t )=∫0 +∞ϕs (f (p (u )))d u ϕs (f (p (t )))

仿照体渲染公式，定义 opaque density function ρ ( t ) \rho(t)ρ(t )，代替标准体渲染中的 σ \sigma σ。权重方程表示为：

w ( t ) = T ( t ) ρ ( t ) , where T ( t ) = exp ⁡ ( − ∫ 0 t ρ ( u ) d u ) w(t)=T(t) \rho(t), \quad \text { where } T(t)=\exp \left(-\int_{0}^{t} \rho(u) \mathrm{d} u\right)w (t )=T (t )ρ(t ),where T (t )=exp (−∫0 t ρ(u )d u )

根据几何关系，f ( p ( t ) ) = ∣ cos ⁡ ( θ ) ∣ ⋅ ( t − t ∗ ) f(\mathbf p (t)) = |\cos (\theta)| \cdot\left(t-t^{}\right)f (p (t ))=∣cos (θ)∣⋅(t −t ∗)，其中f ( p ( t ∗ ) ) = 0 f(\mathbf p (t^))=0 f (p (t ∗))=0，θ \theta θ 是视角方向与物体表面法向量 n \mathbf n n 的夹脚，这里可以看成常量。仍然使用上面的直接方法表示权重w ( t ) w(t)w (t )，有

w ( t ) = ϕ s ( f ( p ( t ) ) ) ∫ − ∞ + ∞ ϕ s ( f ( p ( u ) ) ) d u = ϕ s ( f ( p ( t ) ) ) ∫ − ∞ + ∞ ϕ s ( − ∣ cos ⁡ ( θ ) ∣ ⋅ ( u − t ) ) d u = ϕ s ( f ( p ( t ) ) ) ∣ cos ⁡ ( θ ) ∣ − 1 ⋅ ∫ − ∞ + ∞ ϕ s ( u − t ) d u = ∣ cos ⁡ ( θ ) ∣ ϕ s ( f ( p ( t ) ) ) \begin{aligned} w(t) &=\frac{\phi_{s}(f(\mathbf{p}(t)))}{\int_{-\infty}^{+\infty} \phi_{s}(f(\mathbf{p}(u))) \mathrm{d} u} \ &=\frac{\phi_{s}(f(\mathbf{p}(t)))}{\int_{-\infty}^{+\infty} \phi_{s}\left(-|\cos (\theta)| \cdot\left(u-t^{}\right)\right) \mathrm{d} u} \ &=\frac{\phi_{s}(f(\mathbf{p}(t)))}{|\cos (\theta)|^{-1} \cdot \int_{-\infty}^{+\infty} \phi_{s}\left(u-t^{}\right) \mathrm{d} u} \ &=|\cos (\theta)| \phi_{s}(f(\mathbf{p}(t))) \end{aligned}w (t )=∫−∞+∞ϕs (f (p (u )))d u ϕs (f (p (t )))=∫−∞+∞ϕs (−∣cos (θ)∣⋅(u −t ))d u ϕs (f (p (t )))=∣cos (θ)∣−1 ⋅∫−∞+∞ϕs (u −t )d u ϕs (f (p (t )))=∣cos (θ)∣ϕs (f (p (t )))

为了求出 ρ ( t ) \rho(t)ρ(t )，有 T ( t ) ρ ( t ) = ∣ cos ⁡ ( θ ) ∣ ϕ s ( f ( p ( t ) ) ) = − d Φ s d t ( f ( p ( t ) ) ) = d T d t ( t ) T(t) \rho(t) = |\cos (\theta)| \phi_{s}(f(\mathbf{p}(t))) = -\frac{\mathrm{d} \Phi_{s}}{\mathrm{~d} t}(f(\mathbf{p}(t))) = \frac {\mathrm{d}T}{\mathrm{d}t}(t)T (t )ρ(t )=∣cos (θ)∣ϕs (f (p (t )))=−d t d Φs (f (p (t )))=d t d T (t )

所以，T ( t ) = Φ s ( f ( p ( t ) ) ) T(t)=\Phi_{s}(f(\mathbf{p}(t)))T (t )=Φs (f (p (t )))，求得

ρ ( t ) = − d Φ s d t ( f ( p ( t ) ) ) Φ s ( f ( p ( t ) ) ) \rho(t)=\frac{-\frac{\mathrm{d} \Phi_{s}}{\mathrm{~d} t}(f(\mathbf{p}(t)))}{\Phi_{s}(f(\mathbf{p}(t)))}ρ(t )=Φs (f (p (t )))−d t d Φs (f (p (t )))

上式是单个surface的情况，当光线在两个surface之间时会变成负，把它拓展到多surface的情况需要在这时将之设为0。

ρ ( t ) = max ⁡ ( − d Φ s d t ( f ( p ( t ) ) ) Φ s ( f ( p ( t ) ) ) , 0 ) \rho(t)=\max \left(\frac{-\frac{\mathrm{d} \Phi_{s}}{\mathrm{~d} t}(f(\mathbf{p}(t)))}{\Phi_{s}(f(\mathbf{p}(t)))}, 0\right)ρ(t )=max (Φs (f (p (t )))−d t d Φs (f (p (t ))),0 )

最后再使用 w ( t ) = T ( t ) ρ ( t ) w(t)=T(t) \rho(t)w (t )=T (t )ρ(t ) 计算出权重方程。

; Discretization

类似 NeRF，定义采样点 n n n 个：{ p i = o + t i v ∣ i = 1 , … , n , t i < t i + 1 } \left{\mathbf{p}{i}=\mathbf{o}+t{i} \mathbf{v} \mid i=1, \ldots, n, t_{i}，计算的像素颜色为：

C ^ = ∑ i = 1 n T i α i c i \hat{C}=\sum_{i=1}^{n} T_{i} \alpha_{i} c_{i}C ^=i =1 ∑n T i αi c i

T i = ∏ j = 1 i − 1 ( 1 − α j ) T_{i}=\prod_{j=1}^{i-1}\left(1-\alpha_{j}\right)T i =∏j =1 i −1 (1 −αj ) 是离散的累积透射比accumulated transmittance。
α i = 1 − exp ⁡ ( − ∫ t i t i + 1 ρ ( t ) d t ) \alpha_{i}=1-\exp \left(-\int_{t_{i}}^{t_{i+1}} \rho(t) \mathrm{d} t\right)αi =1 −exp (−∫t i t i +1 ρ(t )d t ) 是离散的浑浊度 opacity value。

α i \alpha_i αi 对应前面提到的ρ \rho ρ，可以进一步表示为：

α i = max ⁡ ( Φ s ( f ( p ( t i ) ) − Φ s ( f ( p ( t i + 1 ) ) ) Φ s ( f ( p ( t i ) ) ) , 0 ) \alpha_{i}=\max \left(\frac{\Phi_{s}\left(f\left(\mathbf{p}\left(t_{i}\right)\right)-\Phi_{s}\left(f\left(\mathbf{p}\left(t_{i+1}\right)\right)\right)\right.}{\Phi_{s}\left(f\left(\mathbf{p}\left(t_{i}\right)\right)\right)}, 0\right)αi =max (Φs (f (p (t i )))Φs (f (p (t i ))−Φs (f (p (t i +1 ))),0 )

Training

分为有mask和无mask两种情况。为了优化网络和标准差倒数s s s，随机采样一个batch的像素点和对应的光线P = { C k , M k , O k , v k } P=\left{C_{k}, M_{k}, \mathbf{O}{k}, \mathbf{v}{k}\right}P ={C k ,M k ,O k ,v k }，C k C_k C k 是像素点颜色，M k ∈ { 0 , 1 } M_k \in {0,1}M k ∈{0 ,1 } 指是否存在mask。batch大小设为m m m，一条光线上的采样点数设为 n n n。

定义损失函数：

L = L color + λ L reg + β L mask \mathcal{L}=\mathcal{L}{\text {color }}+\lambda \mathcal{L}{\text {reg }}+\beta \mathcal{L}_{\text {mask }}L =L color +λL reg +βL mask

其中，L color = 1 m ∑ k R ( C ^ k , C k ) \mathcal{L}{\text {color }}=\frac{1}{m} \sum{k} \mathcal{R}\left(\hat{C}{k}, C{k}\right)L color =m 1 ∑k R (C ^k ,C k )，类似IDR，R \mathcal{R}R 采用 L1 loss；Eikonal 项 L r e g = 1 n m ∑ k , i ( ∣ ∇ f ( p ^ k , i ) ∣ − 1 ) 2 \mathcal{L}{r e g}=\frac{1}{n m} \sum{k, i}\left(\left|\nabla f\left(\hat{\mathbf{p}}{k, i}\right)\right|-1\right)^{2}L r e g =n m 1 ∑k ,i (∣∇f (p ^k ,i )∣−1 )2；可选项 L mask = B C E ( M k , O ^ k ) \mathcal{L}{\text {mask }}=\mathrm{BCE}\left(M_{k}, \hat{O}{k}\right)L mask =B C E (M k ,O ^k )，O ^ k = ∑ i = 1 n T k , i α k , i \hat{O}{k}=\sum_{i=1}^{n} T_{k, i} \alpha_{k, i}O ^k =∑i =1 n T k ,i αk ,i 是采样点权重的和，BCE是 Binary Entropy Loss。

分层采样 Hierarchical Sampling

不像NeRF同时优化 coarse 和 fine 网络，这里只维持一个网络，coarse阶段采样的概率是基于 S-density ϕ s ( f ( x ) ) \phi_s(f(\mathbf x))ϕs (f (x )) 和一个大的固定的标准差计算得到，而fine阶段采样的概率基于 ϕ s ( f ( x ) ) \phi_s(f(\mathbf x))ϕs (f (x )) 和学得的标准差。

实现细节

; 实验

Surface reconstruction with mask

Surface reconstruction w/o mask

Ablation study

; Thin structures

Original: https://blog.csdn.net/m0_46094914/article/details/124324284
Author: 萨瓦河的太阳
Title: NeuS: Learning Neural Implicit Surfaces by Volume Rendering for Multi-view Reconstruction 论文笔记

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/650171/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【目标检测-YOLO】YOLO v5 训练最好结果的技巧

来自：Tips for Best Training Results 📌 – YOLOv5 Documentation Tips for Best Training Re…

人工智能 2023年7月22日
0067
渠道创新｜如何以线下门店运营创新，解汽车经销行业之困

售后业务对于门店持久运营至关重要，提升售后竞争力，拥有稳固的客户基盘以及行之有效的盘活策略必不可少。面对新车销售增收不增利的低迷环境，门店的整体运营需要依靠售后服务和部分精品销售…

人工智能 2023年6月4日
0094
1-第1章第1节-五次多项式-会用公式就行

第一章：数学第一节、五次多项式（这个推导可以看一下我手写的笔记！！！） 1. 舒适性指标：跃度：Jerk=加速度关于时间的导数（Jerk绝对值越小=a变化越平缓=越舒适）假设质…

人工智能 2023年6月15日
0055
FPGA学习–RGB-LCD屏彩条显示实验

FPGA学习–RGB-LCD屏彩条显示实验 * – + RGB-LCD屏原理 + 程序设计参考正点原子视频 RGB-LCD屏原理 LCD 是一种液晶显示屏…

人工智能 2023年6月20日
00101
数据分析第二回-数据清洗与特征处理

接下来要重点研究一下数据清洗，一般我们拿到数据的时候，有很多错误的情况。所谓的错误，就是数据中有缺失值，有一些异常点等，需要经过一定的处理才能继续做后面的分析或建模，所以拿到数据的…

人工智能 2023年7月17日
0052
玩转Atlas 200DK（五）OpenCV的安装

五、OpenCV的安装 8、使用MindStudio运行YoLoV3样例工程我们记得上次说到OpenCV的安装比较麻烦。是因为OpenCV需要实现交叉编译，即需要在开发环境x86…

人工智能 2023年7月20日
0054
Python爬虫-scrapy基本使用

Scrapy是一个为了爬取网站数据，提取结构性数据而编写的应用框架。可以应用在包括数据挖掘，信息处理或存储历史数据等一系列的程序中。终端输入 scrapy startproje…

人工智能 2023年7月17日
0045
【数学建模常用模型】分类专题

这次介绍一下数模国赛常用的分类方法，以下这方法也是现在应用比较广泛的分类方法：K-近邻算法（k-Nearest Neighbors，KNN）和支持向量机（Support Vecto…

人工智能 2023年5月31日
00119
python数据分析基础008 -利用pandas带你玩转excel表格（中下篇）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月5日
0078
python复制csv数据_python数据处理之如何选取csv文件中某几行的数据

有些人看到这个问题觉得不是问题，是嘛，不就是df.col[]函数嘛，其实忽略了一个重点，那就是我们要省去把csv文件全部读取这个过程，因为如果在面临亿万级别的大规模数据，得到的结果…

人工智能 2023年7月8日
0076
太赞了，30 个 Python 函数，加速你的数据分析处理速度

Pandas 是 Python 中最广泛使用的数据分析和操作库。它提供了许多功能和方法，可以加快「数据分析」和「预处理」步骤。为了更好的学习 Python，我将以客户流失…

人工智能 2023年7月8日
0058
【神经网络学习】鸢尾花分类的实现

目录 1.问题 2.问题解决思路 3.神经网络理论准备 4.Tensor Flow编程基础 5. 鸢尾花分类神经网络实现 1.问题鸢尾花分为：狗尾草鸢尾、杂色鸢尾、弗吉尼亚鸢尾；…

人工智能 2023年7月2日
00166
Nginx解决vue项目服务器部署以及跨域访问后端

准备（1）首先是一个Vue项目。（2）其次准备好服务器（在这里我是用虚拟机VMware）。（3）准备好一个SpringBoot后端代码。（4）服务器上必须安装Nginx。 …

人工智能 2023年6月29日
00127
吴恩达 – 机器学习课程笔记（持续更新）

一、机器学习 1.1 机器学习定义计算机程序从经验E中学习，解决某一任务T，进行某一性能P，通过P测定在T上的表现因经验E而提高eg：跳棋程序E：程序自身下的上万盘棋局T：下…

人工智能 2023年7月25日
0045
语义解析(一) —— 概述（数据和模型简介）

一、简介语义解析是近几年发展起来的一个NLP的分支，主要目的是将自然语言的文本描述，自动转成机器语言（SQL）语句。也称Text-to-SQL， nl2SQL等。随着知识图谱的…

人工智能 2023年6月1日
0066
【笔记本智能计划】使用OpenCv搭建一个简便实用的智能防盗监控系统

前言本计划是基于笔记本电脑，通过编程打造一个智能笔记本系统，使得我们使用笔记本起来更加智能。整个计划包括但不限于：身份认证、手势控制、手指控制鼠标、防盗监控系统、语音识…

人工智能 2023年7月19日
0045

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30