NeRF 源码分析解读（三）

2023年8月23日上午2:14 • Python • 阅读 55

NeRF 源码分析解读（三）

光线的生成

上一章节我们对 NeRF 模型的初始化代码进行了分析，即 create_nerf() 部分，本章节我们继续对 NeRF 代码进行分析注释。
我们回顾一下前两节的内容：

def train():

    if args.dataset_type == 'llff':
    elif ...
    ...

    render_kwargs_train, render_kwargs_test, start, grad_vars, optimizer = create_nerf(args)
    ...

    if args.render_only: ...

初始化网络模型之后我们继续向下分析代码，会发现一个渲染操作的判断 if args.render_only 。在网络模型训练好以后我们保存整个网络，在测试渲染时只需要将 render_only 参数置 True，不再对网络进行训练，直接得到渲染结果。核心代码在于渲染函数，我们先不对这一块儿代码进行分析，按照训练的流程，在初始化光线以后需要渲染得到像素值，因此我们对渲染函数的分析留在光线生成之后。我们继续向下分析代码。
下面的代码会涉及到光线的生成部分，比较重要

def train():

    ...

    N_rand = args.N_rand

    use_batching = not args.no_batching
    if use_batching:
        ...

use_batching 参数决定了是否从多个角度进行光线投射。源代码中对 lego 小车重建时参数为 False，这里我们为了读者能够更好的理解，同样对这部分代码进行解析。

def train():

    ...

    if use_batching:
        print('get rays')
        rays = np.stack([get_rays_np(H, W, K, p) for p in poses[:,:3,:4]], 0)
        print('done, concats')
        rays_rgb = np.concatenate([rays, images[:, None]], 1)
        rays_rgb = np.transpose(rays_rgb, [0,2,3,1,4])
        rays_rgb = np.stack([rays_rgb[i] for i in i_train], 0)
        rays_rgb = np.reshape(rays_rgb, [-1,3,3])
        rays_rgb = rays_rgb.astype(np.float32)
        print('shuffle rays')
        np.random.shuffle(rays_rgb)

        print('done')
        i_batch = 0

我们可以看到，这段代码的核心在于 get_rays_np() 函数，其他的操作都是一些数据的变换，因此我们对 get_rays_np() 函数进行代码分析。

def get_rays_np(H, W, K, c2w):
    i, j = np.meshgrid(np.arange(W, dtype=np.float32), np.arange(H, dtype=np.float32), indexing='xy')
    dirs = np.stack([(i-K[0][2])/K[0][0], -(j-K[1][2])/K[1][1], -np.ones_like(i)], -1)

    rays_d = np.sum(dirs[..., np.newaxis, :] * c2w[:3,:3], -1)

    rays_o = np.broadcast_to(c2w[:3,-1], np.shape(rays_d))
    return rays_o, rays_d

np.meshgrid(a, b，indexing = "xy") 函数会返回 b.shape() 行，a.shape() 列的二维数组。因此 i, j 都是 [H, W] 的二维数组。i 的每一行代表 x 轴坐标，j 的每一行代表 y 轴坐标。如此一来我们的到了一个图片的每个像素点的笛卡尔坐标。
我们回到第二节提到的相机内参 K

K = np.array([
           [focal, 0, 0.5*W],
           [0, focal, 0.5*H],
           [0, 0, 1]

我们利用相机内参 K 计算每个像素坐标相对于光心的单位方向：

dirs = np.stack([(i-K[0][2])/K[0][0], -(j-K[1][2])/K[1][1], -np.ones_like(i)], -1)

我们对计算公式进行分析。如下图所示，在相机坐标系下根据小孔成像原理求解像素平面上一点到相机光心的方向：

如图，空间中一点 P 经过光心 O （小孔）在成像平面上呈一点 P’ ，并且呈一个倒立的像。我们以光心所在的面建立相机坐标系，那么光心所在的位置可以表示为 ( W 2 , H 2 , 0 ) (\frac{W}{2} ,\frac{H}{2}, 0 )(2 W ,2 H ,0 ) ，成像点 P’ 的位置可以表示为 ( i , j , − f ) (i ,j,-f)(i ,j ,−f ) 。
由此两点位置，我们可以确定一个方向向量 O P ′ → = ( i − W 2 , j − H 2 , − f ) \overrightarrow{OP’} = (i – \frac{W}{2}, j – \frac{H}{2}, -f)O P ′=(i −2 W ,j −2 H ,−f ) 。由于小孔成像呈一个倒立的像，因此我们对 O P ′ → \overrightarrow{OP’}O P ′ 的 Y 轴坐标取反，并对 O P ′ → \overrightarrow{OP’}O P ′ 的 Z 轴归一化。我们得到一个新的方向向量：( ( i − W 2 ) / f , − ( j − H 2 ) / f , − 1 ) ((i – \frac{W}{2})/f, -(j – \frac{H}{2})/f, -1)((i −2 W )/f ,−(j −2 H )/f ,−1 ) 。
由此公式我们得到每个像素点关于光心 O 的方向 dirs 。随后我们利用相机外参转置矩阵将相机坐标转换为世界坐标。

rays_d = np.sum(dirs[..., np.newaxis, :] * c2w[:3,:3], -1)

事实上 get_rays() 函数与 get_rays_np() 函数基本是一致的，只不过是 torch.meshgrid(a, b) 返回的是 a.shape() 行，b.shape() 列的二维数组。因此需要一个转置操作 i.t() ，其余步骤相同。
至此我们生成了每个方向下的像素点到光心的单位方向（Z 轴为 1）。我们有了这个单位方向就可以通过调整 Z 轴坐标生成空间中每一个点坐标，借此模拟一条光线。
光线生成步骤基本结束，后续我们开始分析训练步骤中关于批处理光线以及空间中位置生成的部分 NeRF 源码分析解读（四）。

Original: https://blog.csdn.net/qq_41071191/article/details/125613474
Author: 面里多加汤
Title: NeRF 源码分析解读（三）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/757187/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Pygame:外星人入侵

《python编程从入门到实践》（第二版）实践项目1：pygame游戏：外星人入侵文档说明： 游戏主&…

Python 2023年9月18日
0056
python画恐龙_用Python实现谷歌的小恐龙游戏

”’云”’classCloud( pygame. sprite. Sprite):def__init__( self, imagep…

Python 2023年9月23日
0029
C++文件操作

1.创建文件流创建文件流需要包含头文件 #include 创建文件输入流对象 ofstream file; 创建文件输出流对象 ifstream file; 2.写入文本文件 1…

Python 2023年8月22日
0043
STP生成树

1、生成树是为了防止二层环路造成的广播风暴。通过阻塞环路的某个端口从而达到消除环路的目的。 2、生成树的选举过程： ①选举根桥：根据BPDU报文中的BID选举根桥。BID为优先级…

Python 2023年6月15日
0040
使用Django发送邮件

Django中内置了邮件发送功能，被定义在django.core.mail模块中。发送邮件需要使用SMTP服务器，常用的免费服务器有：163、126、QQ，下面以163邮件为例。 …

Python 2023年8月4日
0064
一小伙使用 python爬虫来算命？

1.获取内容我们今天呢，就先做一个通过星座来得知三天的运势的小玩意，这里有十二个星座，我点了第一个和第二个进去，也就是白羊座和金牛座：就会发现一个规律通过观察网址的链接，我…

Python 2023年6月9日
0073
react native手势触摸

TouchableWithoutFeedback：这个组件在点击后没有任何的视觉反馈，并且只支持一个子节点（不能为0 && 不能>1），并且该组件不支持加s…

Python 2023年11月8日
0042
【操作系统 | Linux】文件管理五件套（查看，切换，创建删除，复制移动）

🤵‍♂️ 个人主页: @计算机魔术师 👨‍💻 作者简介：CSDN内容合伙人，全栈领域优质创作者。 🌐 推荐一款找工作神器网站: 牛客网🎉🎉|笔试题库|面试经验|实习招聘内推 …

Python 2023年5月24日
0063
案例：如何应对因网络参数导致的TPS呈锯齿状？

在苍茫的性能分析道路上，不管你是一只多老的鸟，在经历了多个性能测试的项目之后，你都会发现对于性能问题而言，你仍然不敢说能全部解决。因为下一个问题可能真的是你完全没有见过的。再加上…

Python 2023年10月8日
0030
关于挂科我想说几句

就在前不久我经历了人生中的第一次–补考。早就想写一个随笔来记录这段经历，但想了又想，也不知道咋写，还记得那是一个上午，是在放寒假的时候，成绩早出来了一直没敢查，查完后看…

Python 2023年6月10日
0080
【Flask】YOLO挖掘机目标检测模型Python flask部署（附项目链接）

我是一个甜甜的大橙子🍊，欢迎关注✉️！我相信技术的力量💪努力将所学分享给大家😎你的点赞❤️分享🚀收藏📖就是对我最大的鼓励！文章目录说明 flask项目结构及效果主程序代码项…

Python 2023年8月9日
00131
【论文考古】联邦学习开山之作 Communication-Efficient Learning of Deep Networks from Decentralized Data

B. McMahan, E. Moore, D. Ramage, S. Hampson, and B. A. y Arcas, “Communication-Effic…

Python 2023年10月26日
0033
基于Xlinx的时序分析与约束（6）—-如何读懂vivado下的时序报告？

写在前面 1、建立工程与添加时序约束 2、时序报表写在前面在之前的文章中写了一些时序分析的基础概念，同时还说了文章中提到的公式根本就不需要记忆，因为综合工具vivado会帮你把…

Python 2023年11月5日
0054
python爬虫天气实例scrapy_2017.08.04 Python网络爬虫之Scrapy爬虫实战二天气预报…

1.项目准备：网站地址：http://quanzhou.tianqi.com/ 2.创建编辑Scrapy爬虫： scrapy startproject weather scrapy…

Python 2023年10月5日
0057
ADPCM(自适应差分脉冲编码调制)的原理和计算

关于ADPCM ADPCM(Adaptive Differential Pulse Code Modulation, 自适应差分脉冲编码调制) 是一种音频信号数字化编码技术, 音频…

Python 2023年10月14日
0046
Django 基础，创建一个Django,并成功在网页中运行

执行以下命令，就会自动创建项目和相关文件： django-admin startproject mysite 此时创建的文件夹和文件有以下: mysite/ manage.py m…

Python 2023年8月5日
0061

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

NeRF 源码分析解读（三）

光线的生成

大家都在看