泛化nerf系列：pixelNeRF 一种基于NeRF的多视角三维重建网络

2023年6月17日上午4:25 • 人工智能 • 阅读 96

1摘要

文中提出了一种新的学习框架PixelNeRF，针对的是原本NeRF的不足。即现有的构建神经辐射场的方法往往需要大量的已知观察视角的图片作为输入并且需要花费大量的训练时间。PixelNeRF为了克服这些不足，允许网络跨多个场景被训练以学习先前的场景（ 获取场景先验知识），使其能够以前馈的方式从稀疏（ sparse）的视图集(如一个)执行新的视图合成。利用NERF的体绘制方法，文中的模型可以在没有显式3D监督的情况下直接从图像训练。
论文进行了大量实验，实验结果表明，在所有情况下，PixelNeRF在新颖的视图合成和单幅图像3D重建方面的表现都优于当前最先进的基线方法。
以下是对其效果的展示：

; 2论文创新点

与NeRF不使用任何图像特征不同，PixelNeRF将与每个像素对齐的空间图像特征作为输入，先利用卷积网络获得图像的 底特征，将提取到的 底特征加入到NeRF网络的输入中，以学习到场景的 先验知识，这个过程可以由如下公式表示：
F ( x , d , f ) = ( σ , c ) F(x,d,f) = (σ,c)F (x ,d ,f )=(σ,c )
优化之后的模型可以有效学习场景的先验知识，从而在一次训练之后，对于未知场景，仅通过少量输入即可得到新视点的图片。

3框架结构

整体的模型由两部分构成，第一部分是全卷积的图像编码器，用于将图像按像素编码为沿像素对准的特征网络，第二部分则是一个NeRF网络，用于读入空间坐标信息和对应的编码特征，输出颜色和密度值。文中将任务分成了两块，第一部分是单张图像的PixelNeRF，第二部分则是合并多视图的PixelNeRF。

3.1 单张图像的PixelNeRF

对于沿观察方向d d d的目标相机光线的查询点x x x，通过投影和内插法从特征体W W W中提取出对应的图像特征。然后将该特征与空间坐标（包含x x x和d d d）一起传递到NeRF网络f f f中，利用输出的颜色值和体密度进行体渲染，并将结果与目标像素值进行比较，计算渲染损失（Rendering Loss）。这个过程可以由以下公式表示：
f ( γ ( x ) , d ; W ( π ( x ) ) ) = ( σ , c ) f(γ(x),d;W(π(x)))=(σ,c)f (γ(x ),d ;W (π(x )))=(σ,c )

; 3.2合并多视图的PixelNeRF

多视角的图像可以提供更多场景的附加信息并且可以解决单个场景中出现的3D几何模糊的问题。
将输入的第i i i张图像视作I ( i ) I^{(i)}I (i )并将它对应的相机变换设置为P ( i ) = [ R ( i ) , t ( i ) ] P^{(i)}=[R^{(i)}, t^{(i)}]P (i )=[R (i ),t (i )],对于一个新的视角上的相机光线，可以将光线路径上要查询的点坐标x x x和对应的视角方向d d d转换到一致的相机坐标系下，转换的公式如下x ( i ) = P ( i ) x , d ( i ) = R ( i ) d x^{(i)}=P^{(i)}x,d^{(i)}=R^{(i)}d x (i )=P (i )x ,d (i )=R (i )d之后将变换后的空间信息（x x x和d d d）和对应的特征信息提交到NeRF网络f 1 f_1 f 1 中获得中级特征向量，公式如下：
V ( i ) = f 1 ( γ ( x ( i ) , d ( i ) ; W ( i ) ( π ( x ( i ) ) ) ) ) V^{(i)}=f_1(γ(x^{(i)},d^{(i)};W^{(i)}(π(x^{(i)}))))V (i )=f 1 (γ(x (i ),d (i );W (i )(π(x (i )))))
最后再用一个averagepooling操作ψ ψψ来将所有的向量聚合并输入到NeRF网络f 2 f_2 f 2 中，得到最后的体密度和颜色,公式如下：
( σ , c ) = f 2 ( ψ ( V ( 1 ) , . . . , V ( n ) ) ) (σ,c)=f_2(ψ(V^{(1)},…,V^{(n)}))(σ,c )=f 2 (ψ(V (1 ),…,V (n )))

4实验结果

论文地址
 项目地址
 论文代码

Original: https://blog.csdn.net/qq_44916258/article/details/125019005
Author: 略略略06
Title: 泛化nerf系列：pixelNeRF 一种基于NeRF的多视角三维重建网络

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/628490/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

目标检测算法分类

目标检测算法分类： 1、两步走的目标检测：先找出候选的一些区域，再对区域进行调整分类代表：R-CNN、SPP-net、Fast R-CNN、Faster R-CNN 2、端到端的…

人工智能 2023年6月30日
0076
回归特征选取_如何进行高维变量筛选和特征选择(一)？Lasso回归

01 模型简介随着海量电子病历的挖掘，影像学、基因组学等数据进入医学统计分析，经常会面临对高维变量特征选择的问题，Lasso回归是在线性回归模型的代价函数后面加上L1范数的约束项…

人工智能 2023年6月18日
00118
PyQT6的从零开始（一）：在Anaconda下安装PyQT6+在Pycharm中如何配置与使用

一、在Anaconda安装pyqt6 打开Anaconda Navigator如图创建一个新的环境，，我这里是pyqt，当然在控制台也可以创建，或者用已有的但Anaconda里并没…

人工智能 2023年7月6日
0083
Solving environment: failed with initial frozen solve. Retrying with flexible solve.

error1: Solving environment: failed with initial frozen solve. Retrying with flexible solv…

人工智能 2023年5月23日
00115
windows使用GPU2060配置cuda11.1和pytorch

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、安装anaconda 二、安装cuda11.1 * 1.确定自己电脑显卡对应的cuda版本 2…

人工智能 2023年7月22日
0064
实体识别(1) -实体识别任务简介

命名实体识别概念命名实体识别(Named Entity Recognition,简称NER) , 是指识别文本中具有特定意义的词（实体），主要包括人名、地名、机构名、专有名词等等…

人工智能 2023年5月27日
0079
Canal使用

下面我们就开启mysql的主从同步机制，让Canal来模拟salve Canal是基于MySQL的主从同步功能，因此必须先开启MySQL的主从功能才可以。这里以之前用Docker…

人工智能 2023年6月29日
0059
hectf2020部分简单题题解wp

⭐HECTF 我真是又菜又没时间肝题。。又又又只水了波简单题。。。 ⭐Reverse 1、Hello_Re file查一波 32bit，拖进IDA中老规矩shift+F12 查看…

人工智能 2023年6月6日
0083
《计算传播学导论》读书笔记：第二章文本分析简介

目录第二章文本分析简介第一节文本分析研究现状第二节文本分析与传播学研究一、为什么文本挖掘技术逐渐受到传播学者的关注？二、不同的文本分析研究对传播学的理论贡献第三节…

人工智能 2023年5月28日
0090
速度收藏–16个好玩的深度学习在线应用推荐

引言俗话说：不听、不看、不知道、不知道、干成事。 [En] As the saying goes: don’t hear it, don’t see it…

人工智能 2023年5月25日
00106
全国大学生软件测试大赛【嵌入式测试个人赛】【练习题分析】

### 回答1：嵌入式软件测试_指的是对 _嵌入式_系统中的 _软件_进行 _测试_的一种方法。 _嵌入式_系统是指集成了 _软件、硬件和电子元器件等功能于一体的系统，…

人工智能 2023年7月6日
0053
6 pandas

处理字符串时间序列等非数值信息常用数据类型 series 一维带标签数组 dataframe 二维数组 6.1 series 本质由两部分构成：键（索引）+ 值 pd.Se…

人工智能 2023年7月8日
0043
前端AST详解，手写babel插件

🐱个人主页：不叫猫先生🙋‍♂️作者简介：专注于前端领域各种技术，热衷分享，关注我会给你带来一些不一样的认知和成长。📝个人签名：不破不立 🍬本文目录 🥙一、前言 🥪二、节点介绍 🌮…

人工智能 2023年7月31日
00134
基于ROS的导航框架

前言这篇博客给各位介绍一下在ROS环境下常用的局部/全局的导航框架。在机器人运动控制当中。路径规划作为感知定位的下一个部分，机器人需要有一个比较合适的路径规划功能才能使机器人安全…

人工智能 2023年6月16日
0090
服务器重启之后NVIDIA出现问题原因汇总

问题一: nvidia-smi报错：NVIDIA-SMI has failed because it couldn’t communicate with the NVI…

人工智能 2023年5月30日
00112
Ubuntu18.04安装cuda10.1+cudnn8.0.5+pytorch1.8.1【亲测～】

Ubuntu18.04安装cuda10.1+cudnn8.0.5+pytorch1.8.1【亲测～】目录第一步：Cuda10.1的安装第二步：Cudnn8.05的安装 *…

人工智能 2023年7月22日
00112

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

泛化nerf系列：pixelNeRF 一种基于NeRF的多视角三维重建网络

3.1 单张图像的PixelNeRF

; 3.2合并多视图的PixelNeRF

大家都在看