手把手教你搭建一个你自己的语音合成系统

语音合成系统

*
1.百度AI开放
2. 安装语音合成 Python SDK
3.新建AipSpeech
4.接口说明
5.登陆账号,创建应用

1.百度AI开放

  今天,我们来一起学习意下如何搭建一个属于你自己的语音合成系统,在这里我们会用到百度的语音合成服务。

第一步
首先我们打开 百度AI开放平台,他的网站域名是https://ai.baidu.com

手把手教你搭建一个你自己的语音合成系统
然后在中间的 语音合成下点击 在线合成-基础音库这个完全免费的,
手把手教你搭建一个你自己的语音合成系统
手把手教你搭建一个你自己的语音合成系统
我们点击技术文档可以看到如下百度语音合成的简介:https://ai.baidu.com/ai-doc/SPEECH/Gk38y8lzk

; 2. 安装语音合成 Python SDK

语音合成 Python SDK目录结构

├── README.md
├── aip                   //SDK目录
│   ├── __init__.py       //导出类
│   ├── base.py           //aip基类
│   ├── http.py           //http请求
│   └── speech.py //语音合成
└── setup.py              //setuptools安装

支持Python版本:2.7.+ ,3.+

安装使用Python SDK有如下方式:

如果已安装pip,执行pip install baidu-aip即可。
如果已安装setuptools,执行python setup.py install即可。

3.新建AipSpeech

AipSpeech是语音合成的Python SDK客户端,为使用语音合成的开发人员提供了一系列的交互方法。

参考如下代码新建一个AipSpeech:

from aip import AipSpeech

""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

在上面代码中,常量 APP_ID在百度云控制台中创建,常量 API_KEYSECRET_KEY是在创建完毕应用后,系统分配给用户的,均为字符串,用于标识用户,为访问做签名验证,可在AI服务控制台中的应用列表中查看。

配置AipSpeech
如果用户需要配置AipSpeech的网络请求参数(一般不需要配置),可以在构造AipSpeech之后调用接口设置参数,目前只支持以下参数:

接口说明

setConnectionTimeoutInMillis 建立连接的超时时间(单位:毫秒
setSocketTimeoutInMillis 通过打开的连接传输数据的超时时间(单位:毫秒)

4.接口说明

接口描述:
基于这个接口,开发者可以很容易地获得语音合成能力。

[En]

Based on this interface, developers can easily acquire speech synthesis capabilities.

请求说明:
合成文本长度必须小于1024字节,如果本文长度较长,可以采用多次请求的方式。文本长度不可超过限制
例如,要将段落合成为语音文件:

[En]

For example, to synthesize a paragraph into a voice file:

result  = client.synthesis('你好百度', 'zh', 1, {
    'vol': 5,
})

if not isinstance(result, dict):
    with open('audio.mp3', 'wb') as f:
        f.write(result)

参数 作用:
tex: 合成的文本,使用UTF-8编码,请注意文本长度必须小于1024字节
cuid: 用户唯一标识,用来区分用户,填写机器 MAC 地址或 IMEI 码,
spd: 语速,取值0-9,默认为5中语速
pit: 音调,取值0-9,默认为5中语调
vol:音量,取值0-15,默认为5中音量
per:发音人选择, 0为女声,1为男声,3为情感合成-度逍遥,4为情感合成-度丫丫,默认为普通女

5.登陆账号,创建应用

然后我们点击下面链接 登录百度账号然后 创建建一个应用https://login.bce.baidu.com/?redirect=https%3A%2F%2Fconsole.bce.baidu.com%2F%3Ffromai%3D1#/aip/overview
创建完成后,我们可以开始编写代码,如下所示:

[En]

After the creation is complete, we can start to write the code, as follows:

from aip import AipSpeech
APP_ID = '24967804'
AIP_KEY = 'L7vUpP61Ir53Dy2DLQrlAGxK'
SECRET_KEY = 'nbjrOt0rY6VUIQSrIeumFGZyHUjbjTHv'

client = AipSpeech(APP_ID,AIP_KEY,SECRET_KEY)

s = input('请输入合成文本:')
result = client.synthesis(s,'zh',4,{
                                    'spd' :5,
                                    'pit' :8,
                                    'vol' :5,
                                })

if not isinstance(result,dict):
    with open('audio.mp3','wb') as f:
        f.write(result)

最后,我们运行代码来输入我们想要合成的文本,然后我们就可以合成相应的语音。

[En]

Finally, we run the code to enter the text we want to synthesize and then we can synthesize the corresponding speech.

Original: https://blog.csdn.net/m0_55541215/article/details/120753024
Author: 不练剑的游侠
Title: 手把手教你搭建一个你自己的语音合成系统

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/512177/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球