AI画师技术又精进了? AI画师三维版试玩——Dreamfields和DreamFusion向文本生成3D模型领域进发

2023年6月26日上午3:04 • 人工智能 • 阅读 98

0、AI画师二维版的出圈

最近AI画师的杰出表现让人惊讶无比，2022虽然不是ai绘图这项技术诞生的时间，但却是到目前为止最爆火出圈的绘图元年，现在市场上也已经有了很多成熟的AI绘画APP：用户仅需打开相应的AI绘画软件，在创作页面，只需要输入相应的关键词，你想生成什么样的画就输入什么关键词，然后点击创作，十几秒后，一幅惊艳的画作就生成了，如下都是NovelAI生成的图像：

AI画师技术又精进了? AI画师三维版试玩——Dreamfields和DreamFusion向文本生成3D模型领域进发

; 1、AI画师三维版的兴起

然而最近，二维版的绘画领域已经满足不了AI了，AI已经开始进入3D世界， 直接一句话/一张图，生成3D模型、立体人像、全方位环绕视频，输入简单的文本提示，就能生成3D模型，比如

一幅美丽的花树画，Chiho Aoshima风格，长镜头，超现实主义：

可以看到生成的模型不仅可以渲染生动的 物体形状，还可以渲染合理的 光线、颜色、密度，更重要的是， 生成的3D模型还可以导出到网格中，用建模软件进一步加工。

2、Dreamfields-3D AI画师三维版试玩

前不久 Dreamfields-3D已经宣布开源，并且提供了colab地址！

这意味着AI画师三维版玩法十分低门槛，对我们本地机器没有任何硬性配置要求，直接在线就可以colab试玩了。大致只需要三步。这里我们介绍一下colab上在线玩的步骤：

2.1、第一步：进入colab

首先打开Dreamfields-3D的colab试玩地址，可以看到，Dreamfields-3D的Jupyter Notebook代码：

展开可以看到，其分为三大部分：①机器检查；②环境安装；③训练和测试

; 2.2、第二步：连接Google云端硬盘

点击check the machine的运行按钮

代码需要连接Google云端硬盘读写文件，点击连接。

2.3、第三步：配置参数开始运行

配置一下training和test的设置参数，保存格式有视频和网格两种，输出模型格式为带顶点色的obj和ply。如果你只是简单试玩，可以选择不动他的参数。

然后依次点击运行按钮就可以开始试玩了，初始训练轮数为200轮，每轮运行时间大概需要1分钟，每10轮会进行一次输出，可以观看每10轮的效果：

等待训练完成后，就可以输入自己想要的文本来生成3D模型啦。

; 3、DreamFusion 原理分析

上节我们体验的是Dreamfields-3D，可以看到虽然可以生成模型，但是看起来效果并不是很好，风格比较诡异，而前不久Google Research在Dreamfields-3D基础上做了改进，发布了最新成果DreamFusion，让 生成模型的形态、颜色、光线、密度有巨大的飞跃，虽然 Dreamfusion 还未开放使用，但项目网站提供了生成画廊：DreamFusion预览地址

要 直接训练一个text-to-3D的模型非常困难，因为DALL-E 2等模型的训练需要吞噬数十亿个图像-文本对，但并 不存在如此大规模的3D标注数据，目前 也没有一个高效的模型架构对3D数据进行降噪。DreamFusion先使用一个预训练2D扩散模型基于文本提示生成一张二维图像，然后引入一个基于概率密度蒸馏的损失函数，通过梯度下降法优化一个随机初始化的神经辐射场NeRF模型。

在DreamFusion中，使用了一个预先训练的二维文本到图像 扩散模型，扩散模型是潜在变量生成模型，它学习将样本从可控制的噪声分布逐渐转换为数据分布。

评分蒸馏采样的损失函数叫SDS，其代替CLIP通过文本到图像的Imagen扩散模型来计算损失。用评分蒸馏采样来表示生成过程中的损失，通过不断优化最小化这种损失，
通过优化实现可控制的采样，从而输出质量良好的3D模型。

除此之外，与Dream Fields相比，Dreamfusion通过文本提示生成高质量、深度和普通的背光3D对象。使用Dreamfusion生成的多个3D模型也可以缝合到一个场景中，比如下图，迭代地细化一个示例文本提示，同时从四个不同的方面渲染每个生成的场景：

Dreamfusion 从随机的相机位置和角度反复渲染NeRF的视图，用这些渲染结果作为环绕Imagen的分数蒸馏损失函数的输入。每次迭代都包含四步：①随机采样一个相机和灯光；②从该相机和灯光下渲染NeRF的图像；③计算SDS损失相对于NeRF参数的梯度；④使用优化器更新NeRF参数。

例子：冲浪板上孔雀的单反照片：

; 4、文本生成3D模型的未来

作为一名人工智能领域研究生，早在21年上半年，我就开始深入文本生成图像领域，可以说，领域内一年半来的发展真的非常迅速，目前都已经有很多比较成熟的商业应用，自从文本引导的图像生成模型火了以后，画家群体迅速扩张，不会用画笔的人也能发挥想象力进行艺术创作。

那么对于文本生成3D这个新的领域，未来AI用于模型设计辅助的潜力也是值得期待，不仅能帮助画师进行设计，也许还能帮助建模师/设计师进行 3D建模、产品设计、学术建模、建筑设计、元宇宙开发等等，潜力无限，为何不现在就开始学习新工具，开始全新的创意探索呢？

💡 最后

我们已经建立了🏤 T2I研学社群，如果你对Dreamfields和DreamFusion还有其他疑问或者对🎓 文本生成图像/文本生成3D方向很感兴趣，可以点击下方链接或者私信我 加入社群。

📝 加入社群抱团学习：中杯可乐多加冰-采苓AI研习社

🔥 限时免费订阅：文本生成图像T2I专栏

🎉 支持我：点赞👍+收藏⭐️+留言📝

Original: https://blog.csdn.net/air__Heaven/article/details/127735060
Author: 中杯可乐多加冰
Title: AI画师技术又精进了? AI画师三维版试玩——Dreamfields和DreamFusion向文本生成3D模型领域进发

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/652032/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

如何选择适合模型部署的硬件设备

问题介绍在进行模型部署时，选择合适的硬件设备是非常重要的。选择适当的硬件设备可以提高模型的性能和效率，从而更好地满足实际需求。本文将详细介绍如何选择适合模型部署的硬件设备，并给出…

人工智能 2024年1月4日
0055
【强化学习】Q-Learning算法详解以及Python实现【80行代码】

在文章正式开始前，请不要被强化学习的tag给吓到了，这也是我之前所遇到的一个困扰。觉得这个东西看上去很高级，需要一个完整的时间段，做详细的学习。相反，强化学习的很多算法是很符合直观…

人工智能 2023年6月23日
0077
CV16 人脸检测：Haar级联

文章目录 * – Haar级联简介 – + 什么是Haar？ + 什么是级联？ + 优劣对比 – 获取Haar级联数据 – 检测人脸…

人工智能 2023年7月2日
0097
Neo4j 小白必看的电影知识图谱（Movie Graph：Try Neo4j with live data）

Neo4j 电影知识图谱 Movie Graph初探前言 1. 创建Graph 2. 查找Data 3. 查询Relation 4. 解决方案 ; 前言使用实时数据尝试Neo4…

人工智能 2023年6月1日
0071
Multi-Label Image Classification（多标签图像分类）

Multi-Label Classification首先分清一下multiclass和multilabel：多类分类(Multiclass classification): 表示…

人工智能 2023年7月1日
0097
Python安装cv2，tkinter等库

当我们需要安装一些必要的库文件，例如：cv2，tkinter等，会遇到许多问题所有的库文件都可以类比以下方法去下载安装方法：打开命令输入行，输入： pip install c…

人工智能 2023年7月18日
0090
机器学习相关解答

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月17日
0080
python删除空值多于50%的行_删除Pandas中“空”值超过60%的列

我有一个这样的数据框：import pandas as pd data = { ‘c1’: [‘Test1′,’Test…

人工智能 2023年7月9日
0077
2022CVPR目标跟踪最新论文

CVPR2022: 论文解读及笔记： CVPR2021 论文解读及笔记：论文解读及笔记： Original: https://blog.csdn.net/qq_39821101/…

人工智能 2023年6月17日
0081
Pandas基础学习笔记（二）——DataFrame用法

一、什么是DataFrame DataFrame是一种表格型的数据结构。它的每一列可以是不同的值类型（例如布尔型、数值型、字符串等），此外它既有行索引index，又有列索引co…

人工智能 2023年7月6日
0079
FPGA用途

FPGA 的用途在介绍 FPGA 的用途之前，先给大家讲一个笑话：话说一个资深工程师出国的时候带了一块 FPGA 开发板。海关问道：”这是什么东西？”…

人工智能 2023年6月20日
0095
简单的二次回归和线性回归的拟合效果对比

文章目录前言 * 本次主要是简单的对比了一下线性回归和二次回归的拟合效果对比，查看两种回归之间的差异。一、引入我们所需要的库二、创建训练数据集和测试数据集，并绘制训练集的散点…

人工智能 2023年6月17日
0097
知识图谱进阶UP!UP!

知识图谱一、知识图谱概论 1.1知识图谱始于20世纪50年代，至今大致分为三个发展阶段： • 第一阶段（1955年—1977年）是知识图谱的起源阶段，在这一阶段中引文网络分析 …

人工智能 2023年6月10日
0087
【演化计算】麻雀优化算法相关原理及代码（Matlab+Python）

目录一、麻雀优化算法简要概述二、算法起源三、算法原理四、算法流程五、核心代码六丶运行结果七丶参考八丶相关代码(Matlab+Python版本)：一、麻雀优化算法简…

人工智能 2023年7月5日
00106
git命令

1、把代码提交到gitee,完全可行，详细操作 1.创建仓库 git init 2.连接仓库 git remote add origin 仓库地址 3.先把仓库都东西更新到本地 g…

人工智能 2023年7月29日
0068
【OpenCV】车辆识别目标检测级联分类器 C++ 案例实现

目录前言一、目标检测技术二、样本采集工作原理三、创建自己的级联分类器 Step1：准备好样本图像 Step2：环境配置（OpenCV win10） Step3：设置路径 S…

人工智能 2023年6月17日
0090

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

AI画师技术又精进了? AI画师三维版试玩——Dreamfields和DreamFusion向文本生成3D模型领域进发

2.1、第一步：进入colab

; 2.2、第二步：连接Google云端硬盘

2.3、第三步：配置参数 开始运行

大家都在看

2.3、第三步：配置参数开始运行