TTS语音合成综述

2023年5月27日下午2:04 • 人工智能 • 阅读 70

Speaker adaptation
If you have very limited data, then you can
consider to try fine-turn pre-trained model. For example, using
pre-trained model on LJSpeech, you can adapt it to data from VCTK
speaker p225 (30 mins) by the following command From my experience, it
can get reasonable speech quality very quickly rather than training
the model from scratch.

所谓voice clone就是，在拿到一个新的没见过speaker的语音之后，只要用户少量的句子(甚至一句), 就可以合成语音来。voice clone包含我们通常用到的adapt和本文新提出的speaker encoding。
最最传统的方式，就是把这些数据加进去微调得到新模型，这也就是clone了。

语音转换技术综述
语音转换（voice conversion）是这样一个任务：输入一条语音，在保持说话内容不变的情况下，让它听起来像是另一个人说的。一个典型的用例，就是柯南的蝴蝶领结变声器。

语音转换的一般过程分为三个步骤：1.特征提取；2.特征转换；3.语音重合成。

[En]

The general process of voice conversion is divided into three steps: 1. Feature extraction; 2. Conversion features; 3. Re-synthesize speech.

Original: https://blog.csdn.net/xys430381_1/article/details/109136036
Author: xys430381_1
Title: TTS语音合成综述

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/526470/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

3.深度学习（一）

文章目录第三章深度学习基础 * 3.1 基本概念 – 3.1.1 神经网络组成？ 3.1.2 神经网络有哪些常用模型结构？ 3.1.3 如何选择深度学习开发平台？ …

人工智能 2023年7月14日
0055
【自用】图像算法、计算机视觉面试问题及答案1.0

传统机器算法 2022.4.11 图像预处理图像预处理的主要目的是消除图像中无关的信息，恢复有用的真实信息，增强有关信息的可检测性、最大限度地简化数据，从而改进特征提取、图像分割…

人工智能 2023年6月20日
0058
猿创征文｜10个Web开发人员必备的最佳开发工具推荐

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月26日
0088
什么是自动编码器，它在深度学习中的作用是什么

什么是自动编码器自动编码器（autoencoder）是一种无监督学习的神经网络模型，用于将数据进行降维或者特征提取。它由一个编码器和一个解码器组成，通过将输入数据压缩为低维编码，…

人工智能 2024年1月1日
0047
Ubuntu基础环境配置及其版本切换(anaconda+opencv+cuda+cmake)

Ubuntu基础环境配置: anaconda+opencv+cuda * 一、下载与安装anaconda* – 1.1下载 – 1.2 安装anaconda…

人工智能 2023年7月19日
0055
特斯拉2021年自动驾驶，特斯拉自动驾驶技术专利

如果马斯克将技术开发给其他车企，这也意味着可以促使更多的车企使用这项技术，当然，成本也可能需要由其他品牌和消费者承担，而目前，特斯拉向订购FSD的车主收取1.2万美元（中国地区6….

人工智能 2023年7月14日
0041
Tensorflow 2.x(keras)源码详解之第八章：keras中构建模型的三种方法(含自定义Model)

大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多…

人工智能 2023年5月23日
0099
人脸与关键点检测：YOLO5Face实战

Github:https://github.com/deepcam-cn/yolov5-face 导读：居然花了一天时间把该项目复现，主要是折腾在数据集格式上，作者居然在train…

人工智能 2023年7月23日
0065
跟着Cell学单细胞转录组分析(六):细胞比例计算及可视化

今天接着单细胞文章的内容：从Cell学单细胞转录组分析(一):开端！！！跟着Cell学单细胞转录组分析(二):单细胞转录组测序文件的读入及Seurat对象构建跟着Cell学单…

人工智能 2023年6月19日
0099
51_Pandas (to_excel) 编写 Excel 文件 (xlsx, xls)

使用 to_excel() 方法将 pandas.DataFrame 写入（保存）为 Excel 文件（扩展名：.xlsx、.xls）。这里，说明以下内容。安装openpyxl…

人工智能 2023年7月17日
0077
三分钟读懂新一代人工智能——ChatGPT

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月31日
0046
目标检测，使用最新的yolov7训练自己的数据集，从零开始的手把手教程

目录一、获取大佬的yolov7源码二、配置深度学习环境三、准备数据集四、用yolo v7训练自己的数据集五、用训练好的模型测试六、用训练好的模型预测一、获取大佬的yo…

人工智能 2023年7月25日
0067
YOLOv5改进之七：损失函数改进

前言：作为当前先进的深度学习目标检测算法YOLOv5，已经集合了大量的trick，但是还是有提高和改进的空间，针对具体应用场景下的检测难点，可以不同的改进方法。此后的系列文章，…

人工智能 2023年6月16日
0095
R语言使用subset函数基于组合逻辑筛选dataframe符合条件的数据行（select observations）、并指定需要保留的dataframe数据列或者字段

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月17日
0052
面向开放词汇的目标检测ECCV2022

目录 1.贡献 2.方法 * 2.1.Open Vocabulary Object Detector 2.2.通过Detector Training实现对齐 2.3.通过Regio…

人工智能 2023年7月9日
0087
python计算平均值画折线图_Python 数据分析测试2 之求平均值及折线图显示

Time: 2020/07/27 Author: Xiaohong 运行环境: OS: Windows 10 Python: 3.7 功能: 导入4份文件(分别对应4个部位)，测算…

人工智能 2023年7月8日
0067

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

TTS语音合成综述

大家都在看