基于Pygame的TTS功能

2023年9月18日下午5:47 • Python • 阅读 48

对于语音转文字的实现，可以调用如科大讯飞，百度之类的API实现，如果自己实现思路也非常简单
第一步将汉字转化为拼音，第二步通过拼音调用相对应声调的音频文件，以下介绍详细的实现方法。
参考文章链接：https://www.v2ex.com/t/393743
全文Github资源地址：https://github.com/wenyichuan/-python

运行环境

Python3.x
Unicode编码表
语音文件
Pygame,pypinyin,unidecode库

一、前置工作

1、在进行语音转文字功能前首先需要统计汉语中一共有多少个音节

此项工作前置条件

安装pypinyin,unidecode,pygame库（可通过cmd界面下Pip install安装）
在百度搜索获取汉字列表复制粘贴到同目录下的all.txt文件

from pypinyin import pinyin
from unidecode import unidecode
import pypinyin
import re
import json
import collections
import itertools
chars = []
with open("all.txt", "r") as file:
    for line in file:
        try:
            chars.append(line.strip())
        except:
            pass

l = list(map(lambda x: pinyin(x, heteronym=True,strict=True,style=pypinyin.NORMAL), chars))

l = list(itertools.chain(*list(itertools.chain(*l))))

l = list(map(unidecode, l))

syllables = list(set(l))

r = re.compile("[a-z]+")
syllables = list(filter(r.match, sorted(syllables)))

d = {}
for i in syllables:
    start = i[0]
    if d.get(start) == None:
        d[start] = [i]
    else:
        d[start].append(i)
od = collections.OrderedDict(sorted(d.items()))

f = open("./result.json","w")
dump = json.dumps(od, indent=4)
print(dump)
f.write(dump)
f.close()
print(len(syllables))

最终可提取出汉字一共有419个音节如下

{
“a”: [
“a”,
“ai”,
“an”,
“ang”,
“ao”
],
“b”: [
“ba”,
“bai”,
“ban”,
“bang”,
“bao”,
“bei”,
“ben”,
“beng”,
“bi”,
“bian”,
“biao”,
“bie”,
“bin”,
“bing”,
“bo”,
“bu”
],
“c”: [
“ca”,
“cai”,
“can”,
“cang”,
“cao”,
“ce”,
“cen”,
“ceng”,
“cha”,
“chai”,
“chan”,
“chang”,
“chao”,
“che”,
“chen”,
“cheng”,
“chi”,
“chong”,
“chou”,
“chu”,
“chua”,
“chuai”,
“chuan”,
“chuang”,
“chui”,
“chun”,
“chuo”,
“ci”,
“cong”,
“cou”,
“cu”,
“cuan”,
“cui”,
“cun”,
“cuo”
],
“d”: [
“da”,
“dai”,
“dan”,
“dang”,
“dao”,
“de”,
“dei”,
“den”,
“deng”,
“di”,
“dia”,
“dian”,
“diao”,
“die”,
“ding”,
“diu”,
“dong”,
“dou”,
“du”,
“duan”,
“dui”,
“dun”,
“duo”
],
“e”: [
“e”,
“ei”,
“en”,
“eng”,
“er”
],
“f”: [
“fa”,
“fan”,
“fang”,
“fei”,
“fen”,
“feng”,
“fiao”,
“fo”,
“fou”,
“fu”
],
“g”: [
“ga”,
“gai”,
“gan”,
“gang”,
“gao”,
“ge”,
“gei”,
“gen”,
“geng”,
“gong”,
“gou”,
“gu”,
“gua”,
“guai”,
“guan”,
“guang”,
“gui”,
“gun”,
“guo”
],
“h”: [
“ha”,
“hai”,
“han”,
“hang”,
“hao”,
“he”,
“hei”,
“hen”,
“heng”,
“hm”,
“hng”,
“hong”,
“hou”,
“hu”,
“hua”,
“huai”,
“huan”,
“huang”,
“hui”,
“hun”,
“huo”
],
“j”: [
“ji”,
“jia”,
“jian”,
“jiang”,
“jiao”,
“jie”,
“jin”,
“jing”,
“jiong”,
“jiu”,
“ju”,
“juan”,
“jue”,
“jun”
],
“k”: [
“ka”,
“kai”,
“kan”,
“kang”,
“kao”,
“ke”,
“kei”,
“ken”,
“keng”,
“kong”,
“kou”,
“ku”,
“kua”,
“kuai”,
“kuan”,
“kuang”,
“kui”,
“kun”,
“kuo”
],
“l”: [
“la”,
“lai”,
“lan”,
“lang”,
“lao”,
“le”,
“lei”,
“len”,
“leng”,
“li”,
“lia”,
“lian”,
“liang”,
“liao”,
“lie”,
“lin”,
“ling”,
“liu”,
“lo”,
“long”,
“lou”,
“lu”,
“luan”,
“lun”,
“luo”,
“lv”,
“lve”
],
“m”: [
“m”,
“ma”,
“mai”,
“man”,
“mang”,
“mao”,
“me”,
“mei”,
“men”,
“meng”,
“mi”,
“mian”,
“miao”,
“mie”,
“min”,
“ming”,
“miu”,
“mo”,
“mou”,
“mu”
],
“n”: [
“n”,
“na”,
“nai”,
“nan”,
“nang”,
“nao”,
“ne”,
“nei”,
“nen”,
“neng”,
“ng”,
“ni”,
“nian”,
“niang”,
“niao”,
“nie”,
“nin”,
“ning”,
“niu”,
“nong”,
“nou”,
“nu”,
“nuan”,
“nun”,
“nuo”,
“nv”,
“nve”
],
“o”: [
“o”,
“ou”
],
“p”: [
“pa”,
“pai”,
“pan”,
“pang”,
“pao”,
“pei”,
“pen”,
“peng”,
“pi”,
“pian”,
“piao”,
“pie”,
“pin”,
“ping”,
“po”,
“pou”,
“pu”
],
“q”: [
“qi”,
“qia”,
“qian”,
“qiang”,
“qiao”,
“qie”,
“qin”,
“qing”,
“qiong”,
“qiu”,
“qu”,
“quan”,
“que”,
“qun”
],
“r”: [
“ran”,
“rang”,
“rao”,
“re”,
“ren”,
“reng”,
“ri”,
“rong”,
“rou”,
“ru”,
“rua”,
“ruan”,
“rui”,
“run”,
“ruo”
],
“s”: [
“sa”,
“sai”,
“san”,
“sang”,
“sao”,
“se”,
“sen”,
“seng”,
“sha”,
“shai”,
“shan”,
“shang”,
“shao”,
“she”,
“shei”,
“shen”,
“sheng”,
“shi”,
“shou”,
“shu”,
“shua”,
“shuai”,
“shuan”,
“shuang”,
“shui”,
“shun”,
“shuo”,
“si”,
“song”,
“sou”,
“su”,
“suan”,
“sui”,
“sun”,
“suo”
],
“t”: [
“ta”,
“tai”,
“tan”,
“tang”,
“tao”,
“te”,
“tei”,
“teng”,
“ti”,
“tian”,
“tiao”,
“tie”,
“ting”,
“tong”,
“tou”,
“tu”,
“tuan”,
“tui”,
“tun”,
“tuo”
],
“w”: [
“wa”,
“wai”,
“wan”,
“wang”,
“wei”,
“wen”,
“weng”,
“wo”,
“wu”
],
“x”: [
“xi”,
“xia”,
“xian”,
“xiang”,
“xiao”,
“xie”,
“xin”,
“xing”,
“xiong”,
“xiu”,
“xu”,
“xuan”,
“xue”,
“xun”
],
“y”: [
“ya”,
“yan”,
“yang”,
“yao”,
“ye”,
“yi”,
“yin”,
“ying”,
“yo”,
“yong”,
“you”,
“yu”,
“yuan”,
“yue”,
“yun”
],
“z”: [
“za”,
“zai”,
“zan”,
“zang”,
“zao”,
“ze”,
“zei”,
“zen”,
“zeng”,
“zha”,
“zhai”,
“zhan”,
“zhang”,
“zhao”,
“zhe”,
“zhei”,
“zhen”,
“zheng”,
“zhi”,
“zhong”,
“zhou”,
“zhu”,
“zhua”,
“zhuai”,
“zhuan”,
“zhuang”,
“zhui”,
“zhun”,
“zhuo”,
“zi”,
“zong”,
“zou”,
“zu”,
“zuan”,
“zui”,
“zun”,
“zuo”
]
}

2、然后根据所获取的音节信息进行语音库的录制

每个音节分为五个声调，平声、一声、二声、三声、四声，最终录制获得2062个音频
文件如下图：

; 3、进行完音频文件的收集后进行汉字转拼音的操作

我们需要将汉字先变为Unicode编码，然后通过在网上搜索下载的Unicode转拼音文件将Unicode转为拼音
文件如下图：

其中英文字母后的1，2，3，4，5分别表示1，2，3，4和平声
到此准备工作全部完成。

二、代码部分

代码部分整体思路分为两个部分

1、汉语转拼音

此部分输入参数为汉字字符串，返回是一个拼音字符串

def chinese_to_pinyin(x):
y = ''
dic = {}
with open("unicode_py.txt") as f:
    for i in f.readlines():
        dic[i.split()[0]] = i.split()[1]
for i in x:
    i = str(i.encode('unicode_escape'))[-5:-1].upper()
    try:
        y += dic[i] + ' '
    except:
        y += 'XXXX '
return y

运行结果如下图：

其中XXXX表示为非法字符的标点符号

2、拼音转语音

此部分需根据上一部分所获取的拼音字符串来调取单个音的音频文件，并用Pygame库提供的mixer方法将其组合为一个完整的发音

def make_voice(x):
    pygame.mixer.init(frequency = 22050,size = -16,channels = 2,buffer = 4096)

    voi = chinese_to_pinyin(x).split()
    for i in voi:
        if i == 'XXXX':
            continue
        pygame.mixer.music.load( "voice/"+i.lower() + ".wav")

        pygame.mixer.music.play()

        while pygame.mixer.music.get_busy() == True:

            pass
    return None
while True:
    p = input("请输入文字：")
    make_voice(p)

3、完整代码如下

import pygame
def chinese_to_pinyin(x):
    y = ''
    dic = {}
    with open("unicode_py.txt") as f:
        for i in f.readlines():
            dic[i.split()[0]] = i.split()[1]
    for i in x:
        i = str(i.encode('unicode_escape'))[-5:-1].upper()
        try:
            y += dic[i] + ' '
        except:
            y += 'XXXX '
    return y
def make_voice(x):
    pygame.mixer.init(frequency = 22050,size = -16,channels = 2,buffer = 4096)

    voi = chinese_to_pinyin(x).split()
    for i in voi:
        if i == 'XXXX':
            continue
        pygame.mixer.music.load( "voice/"+i.lower() + ".wav")

        pygame.mixer.music.play()

        while pygame.mixer.music.get_busy() == True:

            pass
    return None
while True:
    p = input("请输入文字：")
    make_voice(p)

4、后期改进

此程序面对数字时会将其当作非法字符跳过，后期针对此问题参考网上实例，修改后得出以下程序

unitArab=(2,3,4,5,9)
unitStr=u'十百千万亿'
unitStr=u'拾佰仟万亿'

unitDic=dict(zip(unitArab,unitStr))
numArab=u'0123456789'
numStr=u'零一二三四五六七八九'
numStr=u'零壹贰叁肆伍陆柒捌玖'

numDic=dict(zip(numArab,numStr))
def ChnNumber(s):
    def wrapper(v):
        '''针对多位连续0的简写规则设计的函数
        例如"壹佰零零"会变为"壹佰","壹仟零零壹"会变为"壹仟零壹"
        '''
        if u'零零' in v:
            return wrapper(v.replace(u'零零',u'零'))
        return v[:-1] if v[-1]==u'零' else v
    def recur(s,bit):
        '''此函数接收2个参数:
        1.纯数字字符串
        2.此字符串的长度,相当于位数'''

        if bit==1:
            return numDic[s]

        if s[0]==u'0':
            return wrapper(u'%s%s' % (u'零',recur(s[1:],bit-1)))

        if bit<6 or bit==9:
            return wrapper(u'%s%s%s' % (numDic[s[0]],unitDic[bit],recur(s[1:],bit-1)))

        if bit<9:
            return u'%s%s%s' % (recur(s[:-4],bit-4),u"万",recur(s[-4:],4))

        if bit>9:
            return u'%s%s%s' % (recur(s[:-8],bit-8),u"亿",recur(s[-8:],8))
    return recur(s,len(s))
while True:
    p = input("请输入数字：")
    print(ChnNumber(p))

运行截图如下

PS：鸽了好久的文章

Original: https://blog.csdn.net/wenyichuan/article/details/123239751
Author: 冰川_
Title: 基于Pygame的TTS功能

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/779623/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

windows环境Visual Studio2019, C++ & matplotlib

matplotlib是python的常用库，想在C++环境对该库进行使用，借助matplotlib-cpp来实现, https://github.com/lava/matplotl…

Python 2023年9月3日
0055
【博弈论基础与几大经典模型】古诺模型、斯塔克尔伯格模型Stackelberg Game、价格领导模型、Bertrand模型、Sweezy模型

最近阅读了一篇paper中用到了Stackelberg Game建模，于是找了一些资料先学习以下该模型的理论知识，发现很多学科都是相关的，真是神奇的存在。什么是博弈论博弈论(G…

Python 2023年9月28日
0053
MySQLdb、Mysqlclient、PyMySQL 三个python的MySQL库的比较和总结

1.介绍 MySQLdb又叫MySQL-python ，是 Python 连接 MySQL 的一个驱动，很多框架都也是基于此库进行开发，遗憾的是它只支持 Python2.x，而且安…

Python 2023年8月5日
0065
Python 爬虫学习笔记（十(5)）scrapy的POST请求

创建scrapy文件的步骤和之前一样：创建项目 scrapy startproject 项目的名字跳转到scrapy文件夹的目录下创建爬虫文件 scrapy genspide…

Python 2023年10月1日
0029
EDG夺冠！用Python分析22.3万条数据：粉丝都疯了!

原创不易，本文禁止抄袭，转载，违权必究！一、 EDG夺冠信息 11月6日，在英雄联盟总决赛中，EDG战队以3:2战胜韩国队，获得2021年英雄联盟全球总决赛冠军，这个比赛在全网各…

Python 2023年5月25日
0084
推荐 5 个 yyds 的开源 Python Web 框架

提到 Python 的 Web 框架，第一反应就是老三样，Django，Flask 和 Tornado。如果按流行度来排名的话，应该也是这个顺序。在 2016 年，发布了一款 W…

Python 2023年8月5日
0059
基于ROS的SLAM建图、自动导航、避障（冰达机器人）

SLAM是Simultaneous localization and mapping缩写，意为”同步定位与建图”，主要用于解决机器人在未知环境运动时的定位与…

Python 2023年9月30日
0084
【Django】Django使用多数据库

暂未找到一个app应用多个数据库的方法，可使用app与数据库映射的方式去做 settings.py文件配置数据库 DATABASES = { # 默&…

Python 2023年8月4日
0050
Apple芯片Mac无法安装FastGithub arm64版本

最近新入手了M1 MacBook Air，想安装FastGithub来解决GitHub无法访问的问题，于是我下载了arm64版本，发现用不了，用sudo也不行，而且无法生成cace…

Python 2023年6月12日
0080
python贪吃蛇游戏运行时窗口黑屏_Pygame窗口显示空白黑屏

问题：缩进误差您的game_intro()函数已定义，但从未调用您写了gameDisplay而不是screen4次，也用display_width, display_heigh…

Python 2023年9月21日
0061
物理内存虚拟内存以及段页表

物理内存（物理地址）这个是我们大家最能理解的，就是实实在在存在的内存空间。我们对内存的访问现在一般通过内存控制器。我们这里先要能够区别这里的内存空间并不是如外挂储存设备的nand…

Python 2023年10月15日
0046
基于python的opencv图像形态学处理（图像腐蚀与膨胀操作以及礼帽与黑帽）

腐蚀与膨胀图像的腐蚀与膨胀互为逆向操作，通常用于处理二值图像（黑白图，以黑色为底面背景），因此需要先进行二值化处理，腐蚀和膨胀通俗的理解就是，在指定大小的卷积核内，如果该卷积核内…

Python 2023年8月25日
0056
python以第一列为索引列_Python-Pandas-DataFrame 如何把df变为以数据中的某一列为index…

我是一个python新手，问题比较初级，希望大家不要嘲笑我我用pandas读取某个CSV文件(包含两部分，一列时间，五列数据)，我想试图将DataFrame变为以时间为index…

Python 2023年8月6日
0044
大数据——Scrapy爬虫框架安装配置及创建使用

Scrapy爬虫框架安装配置及创建使用 Scrapy爬虫框架安装创建一个Scrapy爬虫框架 Scrapy爬虫框架安装在命令提示符下载 conda install scrapy…

Python 2023年10月5日
0049
matplotlib的引入、常用图形对比及其他常见绘图工具

最流行的Python底层绘图库，主要做数可视化图表，模仿MATLAB构建；作用能将数据进行可视化，更直观的呈现；使数据呈现更客观、更具说服力； matplotlib可绘制的图…

Python 2023年9月2日
0054
解决ValueError: Expected input batch_size (40) to match target batch_size (8).

已解决！！！有bug不要放弃一定要细心追根溯源，花点时间很正常的。 1：bug出现的地方根据报错的信息，我们可以定位在损失函数losses = loss_function_tr…

Python 2023年9月30日
0035

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30