史上训练最简单,音质最好的语音合成系统

vits实现的中文TTS

apt-get install espeak

pip install -r requirements.txt

cd monotonic_align

python setup.py build_ext –inplace

python train.py -c configs/baker_base.json -m baker_base

两张1080卡,训练两天,基本可以使用了

python vits_strings.py

上述模型训练后存在明显的停顿问题。

[En]

There is a problem of obvious pause after the training of the above model.

原因:

1,本来已经在音素后面强插边界了,VITS又强插边界了,具体是配置参数:”add_blank”: true 2,可能影响,随机时长预测,具体配置参数:use_sdp=True,

Original: https://blog.csdn.net/dtx525942103/article/details/120513884
Author: dtx525942103
Title: 史上训练最简单,音质最好的语音合成系统

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/497714/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球