MIT开源最强虚拟人生成器

2023年5月27日下午5:36 • 人工智能 • 阅读 84

MIT虚拟人AI-generated Characters

一、项目简介
二、原理简介
三、代码实现
*
1. 数据准备
2. 函数定义
3. 人物选择/上传
4. 输入驱动选择/上传
5. 视频生成

一、项目简介

麻省理工学院媒体实验室（MIT Media Lab）的研究人员开源了一个虚拟角色生成工具。该工具结合了面部、手势、语音和动作领域的人工智能模型，可用于创建各种音频和视频输出，一举登上《Nature Machine Intelligence》。

该项目主要用于音频或视频驱动的视频，但不支持文本驱动的视频。主要用于医学视频或其他视频通话，保护个人隐私，视频驱动的视频，让历史或现代名人活起来。

[En]

The project is mainly used for audio or video-driven video, but does not support text-driven video. Mainly used for medical video or other video calls to protect personal privacy video-driven video, to make famous historical or modern people alive.

项目地址：https://github.com/mitmedialab/AI-generated-characters

二、原理简介

Character ：可选择给定模板人物，也可自定义上传人物照片（单张图片）。
Inputs：可录音，上传音频，以及上传视频。

首先使用 first-order-model 生成动态视频，然后通过 Wav2Lip 生成嘴型。

若 Inputs 为音频，则调用案例视频驱动 Character 生成相应的动态视频，然后使用 inference.py 生成嘴型。
若 Inputs 为视频，则使用该视频作为驱动生成动态视频，取出视频音轨再合并音视频。

三、代码实现

1. 数据准备

下载 first-order-model & Wav2Lip 以及人物图片。

; 2. 函数定义

定义一些通用函数，如选择/上传人的照片，录制/上传音频，上传视频，以及定义相关函数。

[En]

define some general functions, such as selecting / uploading photos of people, recording / uploading audio, uploading videos, and defining related functions.*
函数 animate_video 定义了，从first-order-model 项目的 demo.py 文件里导入功能
make_animation，将人物照片和驱动视频缩放至256×256，最后保存动态视频
/content/vidvid.mp4（256×256，30fps）

def animate_video(img_filename, vid_filename):   from demo import make_animation   from demo import load_checkpoints   source_image=resize(source_image, (256, 256))[..., :3]   driving_video=[resize(frame, (256, 256))[..., :3] for frame in driving_video]   predictions=make_animation(source_image, driving_video, generator, kp_detector, relative=True,adapt_movement_scale=False)   imageio.mimsave('/content/vidvid.mp4', [img_as_ubyte(frame) for frame in predictions], fps=30)

3. 人物选择/上传

选择模板人物或自定义上传某人的照片(单张图像)。
[En]
Select a template character or customize to upload a photo of a person (a single image).*
模板人物：[“Van Gogh”, “Mona Lisa”, “Einstein”, “Lincoln”, “Nietzsche”, “Sokrates”]。
自定义上传的字符图像的宽度和高度必须相等。
[En]
Custom uploaded character images must be equal in width and height.*

; 4. 输入驱动选择/上传

有三种方式可以输入驱动：录制、上传音频、上传视频。

[En]

There are three ways to input drivers: * recording * , * uploading audio * , and * uploading video * .

5. 视频生成

首先使用 animate_video 生成动态视频。

若前一步骤为音频输入，animate_video 所用的表情驱动为默认案例视频；
若前一步骤为视频输入，animate_video 所用的表情驱动则为该视频。

video_driver = "/content/driving_video.mp4"

然后通过 Wav2Lip 生成嘴型。

若前一步骤为音频输入，则用 inference.py 生成嘴型。
如果上一步是视频输入，请先移除视频轨道，然后再合并音视频。

[En]

if the previous step is video input, remove the video track first and then merge the audio and video.*

参考资料
https://news.mit.edu/2021/ai-generated-characters-for-good-1216
https://www.nature.com/articles/s42256-021-00417-9
https://www.media.mit.edu/articles/characters-for-good-created-by-artificial-intelligence/

Original: https://blog.csdn.net/vivisl/article/details/123483651
Author: vivisl
Title: MIT开源最强虚拟人生成器

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/527089/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【目标检测】MS COCO数据集的使用

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月11日
0046
【超详细】pytorch安装及配置

文章目录前言一、Anaconda安装二、PyTorch的下载及配置 * 1.创建虚拟环境 2.在虚拟环境中下载PyTorch 3.本机CUDA版本低怎么下载CUDA高版本的p…

人工智能 2023年6月16日
0082
CV—BaseLine总结（从AlexNet到SENet的发展历程）

一、初衷深度学习从2015年发展到现在，模型也在不断地迭代优化；现在许多新的模型往往是站在巨人的肩膀上，在这里想记录下baseline模型发展的一个历程，以及不断更新的内容；不…

人工智能 2023年7月13日
0098
AP(affinity propagation)聚类算法

AP(affinity propagation)聚类算法引言 AP(affinity propagation)聚类算法是用来解决什么问题的 AP(affinity propaga…

人工智能 2023年5月31日
0074
数据挖掘-支持向量机(SVM)+代码实现

🤵‍♂️ 个人主页：@Lingxw_w的个人主页✍🏻作者简介：计算机科学与技术研究生在读🐋 希望大家多多支持，我们一起进步！😄如果文章对你有帮助的话，欢迎评论 💬点赞👍🏻 收藏 📂…

人工智能 2023年6月29日
0086
多元多项式回归是一种回归算法，用于建立多个输入特征和多个输出变量之间的多项式关系。它在多元回归的基础上引入了多项式特征，以捕捉数据中的非线性关系

问题介绍多元多项式回归是一种回归算法，用于建立多个输入特征和多个输出变量之间的多项式关系。它在多元回归的基础上引入了多项式特征，以捕捉数据中的非线性关系。在这个问题中，我们将介绍…

人工智能 2023年12月31日
0048
线性回归模型异方差解决方法

线性回归模型异方差解决方法 1.异方差定义 2.异方差检验 * 2.1 残差图 2.2 white检验 3.异方差修正 * 3.1 对原数据做对数处理 3.2 使用OLS稳健标准误…

人工智能 2023年6月17日
0093
Transformer 架构逐层功能介绍和详细解释

多年来，深度学习一直在不断发展。深度学习实践高度强调使用大量参数来提取有关我们正在处理的数据集的有用信息。通过拥有大量参数，我们可以更容易地分类/检测某些东西，因为我们有更多的可以…

人工智能 2023年5月31日
0074
【数据挖掘算法分享】机器学习平台——回归算法之随机森林

随机森林回归算法是决策树回归的组合算法，将许多回归决策树组合到一起，以降低过拟合的风险。随机森林可以处理名词型特征，不需要进行特征缩放处理。随机森林并行训练许多决策树模型，对每个决…

人工智能 2023年6月18日
0088
【UNet3+】遥感影像分割

文章目录 1. 项目准备 * 1.1. 问题导入 1.2. 数据集简介 2. UNet3+模型 * 2.1. 背景介绍 2.2. 模型介绍 – (1) 全尺度跳跃连接 …

人工智能 2023年5月26日
00113
回归算法及应用

目录 1.相关与回归 1.1 有监督的机器学习过程 1.2 分类与回归 1.3 回归的涵义 1.4 案例分析 1.5 回归分析与相关分析 1.6 相关分析 1.7 实战 1.8 小…

人工智能 2023年6月17日
0098
If using all scalar values, you must pass an index

Data[5].choice是对从excel表读出的dataframe某一列的切片，目标是用它们组成新的dataframe并按某一列排序，构建新dataframe的过程中遇到如下报…

人工智能 2023年7月8日
0072
OpenMV：14巡线小车

文章目录 * – + * 追小球的小车 * 巡线小车这个例子展示了在OpenMV Cam上使用get_regression（）方法获得ROI的线性回归。使用这种方法，…

人工智能 2023年5月26日
0072
机器学习—模型选择与优化7-1（k-fold交叉验证法）

404. 抱歉，您访问的资源不存在。可能是网址有误，或者对应的内容被删除，或者处于私有状态。代码改变世界，联系邮箱 contact@cnblogs.com 园子的商业化努力-困…

人工智能 2023年6月4日
0091
【决策树】使用决策树进行乳腺癌的诊断

【决策树】使用决策树进行乳腺癌的诊断 1. 数据集威斯康星乳腺癌数据集 2. 数据集组成：健康组织(良性)和癌变组织(恶性)的数字图像 3. 任务：二分类 → 将组织样本分类为…

人工智能 2023年7月27日
0060
Python他不香吗？四、五行代码就能搞定几百份表格的拆分！

作者: 锋小刀微信搜索【Python与Excel之交】关注我的公众号查看更多内容 当你要重&…

人工智能 2023年7月9日
0066

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31