中文语音库学习

我以前只用过汉字显示的点阵字体,没想到真的有汉字拼音库。

[En]

I have only used the dot matrix font displayed by Chinese characters before, but I didn’t expect that there is really a phonetic library of Chinese characters.

在互联网上科普后,大部分是由主机产生的。

[En]

After the popularization of science on the Internet, most of them are generated by the host computer.

首先说说汉字显示库与汉字语音库的不同,也是最根本的区别,一个汉字对应一个写法,每一个汉字在汉字显示库在都是独一无二的,但是汉字语音库,却不是这样的,,一级字库中有3755个,是常用汉字,二级字库中有3008个,此外还有1W多字基本用不到的汉字,但是它们发音很多都是重复的,如下:

现代汉语普通话共有1327种音节。如果不含声调,则有418种

如果把每一个汉字的发音都存储在语音库中,太浪费了,因此汉字语音库中存在2个表,一个是1327个语音存储表,另一个是GB2312汉字区位码的索引表, 索引表内保存的是此汉字发音在语音存储表中的 长度与偏移地址

发音过程,当输入一个汉字是,其实在计算机中就是2字节的内码,这个也汉字显示库是一样的,再通过内码在索引表中找到此字对应的发音的长度与地址,然后再把PCM语音读出来播放,就完成了汉字语音库的翻译。

上面的原理非常简单,但是实现起来,做成产品还需要处理一些特殊情况,如果,多音字、阿拉伯数字、ASCII字母等,

这种方法,声音比较生硬,它是机器合成的,但可以用在一些低要求的场合,在银行、医院等地方还是用得很多。

[En]

This method, the voice is relatively stiff, it is machine-synthesized, but it can be used in some low-requirement situations, and it is still used a lot in banks, hospitals and other places.

在工业场合下,并不是所有的语句都有可能发出来的,还以银行为例,常用的有”请XXX到2号窗口”,其中XXX是人名,这3个字是不可预期的,因此必须要使用语音库来实现,但是”请到X号窗口”完全可以事先录好,放到机器里,使用时,整个播放出来,因为是事行录好的,因此这句话的流畅度、语调都可以做到非常好,

优化方法可以从2方面着手

1,对于可预期的语句,事先录制好,保存在机器内,

2, 对于不可预期的才从中文语音库中取。

Original: https://blog.csdn.net/wandersky0822/article/details/122945405
Author: wandersky0822
Title: 中文语音库学习

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/512880/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球