百度语音识别异常_百度语音识别和语音合成实战

2023年5月25日下午6:28 • 人工智能 • 阅读 79

概述

随着人工智能的普及，越来越多的产品希望在现阶段增加语音功能。然而，语音识别并不是那么容易，所以各大互联网巨头都推出了语音识别产品。本文主要介绍了百度的语音识别和语言合成功能。

[En]

With the popularity of artificial intelligence, more and more products want to add voice function at this stage. However, speech recognition is not so easy, so the major Internet giants have launched speech recognition products. This article mainly introduces Baidu’s speech recognition and language synthesis functions.

要使用百度的语言功能，需要注册百度云账号，登录百度云，选择百度产品的‘人工智能’，点击‘语言识别’。

[En]

To use Baidu’s language function, you need to sign up for a Baidu Cloud account, log in to Baidu Cloud, select the ‘artificial intelligence’ of Baidu products, and click ‘language recognition’.

点击后显示下面的页面

可以看到有两个按钮，’立即使用’和’技术文档’

我们可以首先构建一个语音产品应用程序，然后单击“立即使用”

[En]

We can first build a voice product application and click ‘use now’

如果它以前没有创建过，则有0个应用程序。您可以先创建应用程序。

[En]

If it has not been created before, then there are 0 applications. You can create applications first.

在此页面上填写您的应用程序名称和应用程序类型，然后选择应用程序的功能。创建完成后，它将生成

[En]

Fill in your application name and application type on this page, and then select the function of the application. When the creation is completed, it will generate

AppID,API Key,Secret Key,把这三个参数需要记录下来。

再打开百度的语音文档

百度的语音识别API是REST API接口，可以使用任意语言来使用。同时百度还提供了多种常见的编程语言的API。我们以python为例子来演示百度的语言识别和语言合成过程.

语音识别

使用python的百度语音识别，需要下载百度的语音SDK包

执行下面命令：pip install baidu-aip

output.wav是使用录音软件录下的16000采样率单声道的语音文件。

from aip import AipSpeechimport wavedef get_pcm_from_wav(filename):wav = wave.open(filename,’rb’)return wav.readframes(wav.getnframes())APP_ID = ‘你自己的AppID’APP_KEY = ‘你自己的app key’SECRET_KEY = ‘你自己的Secret Key’client = AipSpeech(APP_ID,APP_KEY,SECRET_KEY)pcm_con = get_pcm_from_wav(‘output.wav’)res = client.asr(pcm_con,’pcm’,16000,{‘dev_pid:’:1536})print(res)

执行python asr_test.py

输出：

{‘corpus_no’: ‘6763268067273881154’, ‘sn’: ‘172374735471574696057’, ‘err_no’: 0, ‘err_msg’: ‘success.’, ‘result’: [‘这是一个语音测试’]}

语音合成

使用百度的语音合成很简单，稍微修改一下上面的代码：

[En]

Using Baidu’s speech synthesis is very simple, change the above code slightly:

from aip import AipSpeechimport osAPP_ID = ‘你自己的AppID’

APP_KEY = ‘你自己的app key’

SECRET_KEY = ‘你自己的Secret Key’

client = AipSpeech(APP_ID,APP_KEY,SECRET_KEY)result = client.synthesis(‘请把我的文字直接播放’,’zh’,1,{‘vol’:5})if not isinstance(result,dict):with open(‘tts.mp3′,’wb’) as f:f.write(result)os.system(‘play tts.mp3’)

执行python3 tts_test.py

此时，电脑上就可以播放一句《请直接播放我的文字》。

[En]

At this time, the sentence “Please play my text directly” can be played on the computer.

上面的代码在ubuntu16.04下面都调试通过。

郑重声明：本作品为原创，如转载，须注明出处：《标题：物联网电子世界》

[En]

Solemnly declare: this work is original, if reprinted, it must indicate the source “headline: Internet of things Electronic World”

Original: https://blog.csdn.net/weixin_39736379/article/details/113326978
Author: weixin_39736379
Title: 百度语音识别异常_百度语音识别和语音合成实战

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/515456/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

kaggle注册以及数据集下载全流程

kaggle官网：Kaggle Competitions 目录一、注册二、数据集如何下载： 1.第一步，登录进入kaggle网站，导航栏search里搜索自己要下载的数据集 2…

人工智能 2023年7月25日
0097
Knowledge Graph Contrastive Learning for Recommendation（论文笔记）

模型流程： 1.Relation-aware Knowledge Aggregation 这一部分讲解下面两种模型，获取entity和item的第一阶段（first-stage）…

人工智能 2023年6月1日
0089
部署k8s集群（k8s集群搭建详细实践版）

1、部署k8s的两种方式：目前生产部署Kubernetes集群主要有两种方式： *kubeadm Kubeadm是一个K8s部署工具，提供kubeadm init和kubeadm…

人工智能 2023年6月19日
0090
pandas 数据处理（python数据分析活用pandas库）

1.数据组合 1.1连接 1.1.1添加行 1.1.2添加列 1.1.3不同索引下的连接操作 1.2合并多个数据集 1.2.1一对一合并 1.2.2多对一合并 1.2.3多对多合并…

人工智能 2023年7月7日
0078
Window环境运行Tensorflow目标识别示例程序

Tensorflow提供了目标识别的API来支持通过各种深度学习网络实现目标识别的功能。通过访问Github项目https://github.com/tensorflow/mode…

人工智能 2023年5月25日
0064
面向知识图谱的信息抽取

面向知识图谱的信息抽取人工智能技术与咨询点击蓝字 · 关注我们来源：《数据挖掘,》，作者赵海霞等关键词: 知识图谱；信息抽取；实体抽取；关系抽取；开放域摘要：摘要:…

人工智能 2023年6月1日
0074
相机成像原理RAW，RGB，YUV

1.相机成像原理：景物通过镜头（LENS）生成的光学图像投射到图像传感器（SENSOR）表面，然后转为电信号，经过A/D（模数转换）转换后变成数字图像信号，再送到数字信号处理芯片…

人工智能 2023年6月22日
0073
机器学习笔记（聚类）层次聚类 Agglomerative Clutsering（Single-linkage、Complete-linkage，Group average）

1 Agglomerative Clutsering 这是一种自底而上的层次聚类方法。大致可以分为三步： 1.将每一个元素单独定为一类2.每一轮都合并指定距离(对指定距离的理解很重…

人工智能 2023年5月31日
0084
数据分析-Pandas基础

关于数据分析数据分析，宽泛地理解就是对海量数据进行处理、分析等操作，从数据中得到价值。选择这个方向，你可以往数据分析师、数据挖掘、数据产品经理等方向发展。 Pandas 1.Pa…

人工智能 2023年7月6日
0089
pytorch模型导出成ONNX格式：支持多参数与动态输入

pytorch格式的模型在部署之前一般需要做格式转换。本文介绍了如何将pytorch格式的模型导出到ONNX格式的模型。ONNX(Open Neural Network Excha…

人工智能 2023年7月23日
00105
python/numpy-求取最大值、最小值以及求最大最小值的索引-max，np.max，np.amax，np.nanmax，np.fmax，np.maximum

零、前言提要一、参考来源和基础知识小结二、求取容器中的最大值、最小值 2.1 python内置的max()函数 2.2 numpy模块的np.max函数（同np.amax）、n…

人工智能 2023年7月6日
0085
SpringBoot集成OpenCV进行图像处理

目录 * – 一、环境部署 – 二、导入依赖 – 三、使用 – 四、注意事项一、环境部署 *Windows 在OpenCV官网下载…

人工智能 2023年7月19日
0068
使用 CLIP 对没有标记的图像进行零样本无监督分类

深度图像分类模型通常以监督方式在大型带注释数据集上进行训练。随着更多带注释的数据加入到训练中，模型的性能会提高，但用于监督学习的大规模数据集的标注成本时非常高的，需要专家注释者花费…

人工智能 2023年7月13日
0071
论文笔记 EMNLP 2021|Joint Multimedia Event Extraction from Video and Article

文章目录 * – 1 简介 – + 1.1 动机 + 1.2 创新 – 2 背景知识 – 3 方法 – + 3.1 构造…

人工智能 2023年5月28日
0077
【已解决】30系显卡深度学习，jupyter notebook内核挂掉了，需要重启

tensorflow深度学习遇到各种疑难杂症，一律先考虑是不是工具包版本不匹配安装正确对应版本的显卡驱动，python版本，cuda版本，cudnn版本，缺一不可，对应关系如下：…

人工智能 2023年5月25日
0090
R语言回归及混合效应（多水平/层次/嵌套）模型应用及贝叶斯实现

回归分析是科学研究中十分重要的数据分析工具。随着现代统计技术发展，回归分析方法得到了极大改进。混合效应模型（Mixed effect model），或称多水平模型（Multilev…

人工智能 2023年6月17日
0092

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

百度语音识别异常_百度语音识别和语音合成实战

大家都在看