微信小程序-百度AI语音识别——（一）

2023年5月25日下午4:29 • 人工智能 • 阅读 85

微信小程序-百度AI语音识别——（一）

一、百度AI

某天闲来无事在CSDN上看到有大神用百度语音识别+图灵机器人做了一个可以语音聊天（调戏人工智障）的小demo，觉得挺有趣的，也想着实现一下。

百度AI
打开百度AI的官网，看到有很多功能

语音识别

; 二、着手实现（开始踩坑）

本着严谨的原则，肯定要先通过postman工具把接口调通之后再进行开发

1.接口鉴权

套路都一样一个ACCESS KEY 一个 ACCESS SECRET直接请求
https://openapi.baidu.com/oauth/2.0/token

请求之后就可以拿到响应的token （这个token的有效期是2592000秒，30天）

为了实现自动化测试接口，我在postman中添加了一段小脚本，请求到token之后放入环境变量中
微信小程序-百度AI语音识别——（一）

pm.test("token",function(){
    var jsonData = pm.response.json();
    pm.environment.set("TOKEN",jsonData.refresh_token);
});

2.语音识别接口

请求到token之后就可以接着请求语音识别的接口了
百度AI语音识别接口有两种请求方式：

通过json将语音数据进行base64编码后放入请求参数中
通过RAW的方式放入请求主体中进行请求
我个人感觉第一种方式虽然感觉挺方便的，但是对于一个长语音，base64编码会非常的长且会受到不同浏览器 url长度限制
所以放弃了第一种方式，采用RAW的方式
（老实说我居然都没听说过raw这个词，但是原理我是使用过的，就是通过请求体带去数据）

这里我都统一使用采样率16k的音频了，8k的还没测试过
设置请求头：

Content-Type: audio/pcm;rate=16000

将官方提供的测试 pcm格式的文件放入body中

请求到了数据

三、实现demo（坑。。。🕳。。。）

我想着先在浏览器上实现一个简单的小demo
于是二话不说，开搞！

<body>
  <input type="file" name="audio" id="audio-file">
  <button onclick="getToken()">GET TOKENbutton>
body>

它比较简单，功能也很浓缩。

[En]

It is relatively simple, and the functions are condensed.

先上传文件，之后点击按钮会依次获取token 和上传音频文件进行识别
因为要读取文件的二进制内容，我首先想到了js中内置的FileReader对象，并且其中也有readAsBinaryString这样的方法，将文件的二进制内容读出来放入请求体中

 const ACCESS_KEY = "NSuFZs*********lpvdLvKb";
 const ACCESS_SECRET = "iAa************************tG";
let audio_file = document.getElementById("audio-file");
let file_data;
audio_file.onchange = (file) => {
    let reader = new FileReader();

    reader.readAsBinaryString(file.target.files[0]);
    reader.onload = (res) => {
      console.log(res.target.result);
      file_data = res.target.result;
    }
 }

function getToken(){
  let xhr = new XMLHttpRequest();
  xhr.open("POST",
    "https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id="+ACCESS_KEY+"&client_secret="+ACCESS_SECRET
  );
  xhr.send();
  xhr.addEventListener("readystatechange",(res)=>{
    if(xhr.readyState == 4){
      token = JSON.parse(res.target.response).refresh_token;
      soundReco();
    }
  });
}

function soundReco(){
  let xhr = new XMLHttpRequest();
  xhr.open("POST",
    "http://vop.baidu.com/server_api?cuid=155236postman&dev_pid=1537&token="+token
  );

  xhr.setRequestHeader("Content-Type","audio/pcm;rate=16000");
  xhr.addEventListener("readystatechange",(res)=>{
    if(xhr.readyState === 4){
      console.log("***********************",JSON.parse(res.target.response));
    }
  });
  xhr.send(file_data);
}

但是这样请求会返回speech quality error.的错误

显然，文件的参数和内容已经传递了，是吗？

[En]

Obviously, the parameters and the contents of the file have been passed, huh?

猜测可能是纯文本数据的问题。

[En]

The guess may be the problem of plain text data.

于是换用了readAsArrayBuffer这个api

reader.readAsArrayBuffer(file.target.files[0]);

果然请求到了数据！！！

好👌 反正请求到数据了，接下来如何展示还不简单嘛！

在请求过程中会遇到浏览器的跨域问题。目前，我已经通过设置浏览器跨域的方式解决了这个问题。

[En]

The cross-domain problem of the browser will be encountered in the process of the request. At present, I have solved it by setting the browser to cross-domain.

参考这位大佬的方案
浏览器设置跨域

这次demo的开发就先这样吧，狗命要紧~~~~
下一步是改用用户体验更好的平台。我想用微信小程序来实现一个语音识别功能。

[En]

The next step is to change to a platform with a better user experience. I want to use WeChat Mini Programs to achieve a speech recognition function.

四、第二期已更新——微信小程序实现

微信小程序-百度AI语音识别——（二）

项目已经上传gitee

完整工程文件

Original: https://blog.csdn.net/qq_41122414/article/details/113805835
Author: Index[0]
Title: 微信小程序-百度AI语音识别——（一）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/515029/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

盘点8个数据分析相关的Python库（实例+代码）

导读：Python中常会用到一些专门的库，如NumPy、SciPy、Pandas和Matplotlib。数据处理常用到NumPy、SciPy和Pandas，数据分析常用到Panda…

人工智能 2023年7月18日
0085
五、卷积神经网络CNN3（2D与3D卷积、池化）

2D卷积 2D 卷积操作如图 1 所示，为了解释的更清楚，分别展示了单通道和多通道的操作。且为了画图方便，假定只有 1 个 filter，即输出图像只有一个 chanel。其中，…

人工智能 2023年7月13日
0052
python篇—python读取rtsp流，并消耗（多种方式）

文章目录 python篇—python读取rtsp流，并消耗（多种方式） * 1.python读取rtsp流，并消耗（用线程） 2.python读取rtsp流，并消耗（…

人工智能 2023年7月5日
0098
自动驾驶算法详解(1) : Apollo路径规划 Piecewise Jerk Path Optimizer的python实现

本文作为 Apollo Planning决策规划代码详细解析系列文章的补充，将使用Python代码以及anaconda环境，来实现Apollo 决策规划Planning 模块里的 …

人工智能 2023年6月24日
0065
TransE模型学习笔记

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月1日
0079
泰坦尼克号生存率预测

提出问题泰坦尼克号共2224个人，沉船后只有772人存活，生存率仅有32%。尝试建立机器学习模型，通过分析乘客的个人信息，预测个人的存活率，并用测试数据评测模型的预测准确率。数…

人工智能 2023年6月15日
00112
Java中ReentrantLock锁的尝试锁，可中断锁，公平锁讲解与实例代码

前言通过代码实例，展示ReentrantLock的使用和常用属性，展示运行结果，方便理解。 提示：&#x…

人工智能 2023年6月30日
0070
机器学习实战 | 机器学习特征工程最全解读

作者：韩信子@ShowMeAI教程地址：https://www.showmeai.tech/tutorials/41本文地址：https://www.showmeai.tech/a…

人工智能 2023年6月16日
00124
线结构光传感器标定（相机标定+结构光标定）完整流程（一）

1、使用标定板采集图像20张。如下图所示： 2、在采集图像过程中，打开线激光条纹，采集两幅不同姿态下的图像如下图所示：3、成功采集两幅带结构光的图像以及20幅不带结构光的图像后，开…

人工智能 2023年6月2日
00100
Python函数:groupby()

形式： DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=Tr…

人工智能 2023年7月15日
0066
Opencv-python的图像简单颜色处理

获取并修改图像中的像素点我们可以通过行和列的坐标值获取该像素点的像素值。对于BGR图像，它返回一个蓝，绿，红值的数组。对于灰度图像，仅返回相应的强度值。使用相同的方法对像素值进行…

人工智能 2023年7月19日
0082
02 pandas入门

目录 1. pandas数据结构介绍 1.1 Series 1.2 DataFrame 1.3 索引对象 2. 基本功能 2.1 重建索引 2.2 轴向上删除条目 2.3 索引、选…

人工智能 2023年7月8日
0065
OpenCV：对图像的位操作bitwise_and（与），bitwise_or（或），bitwise_not（非），bitwise_xor（异或）

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言 mask 像素按位操作函数 * 1. bitwise_and 2. bitwise_or 3. b…

人工智能 2023年6月17日
0094
Leetcode1704：判断字符串的两半是否相似

给你一个偶数长度的字符串 s 。将其拆分成长度相同的两半，前一半为 a ，后一半为 b 。两个字符串相似的前提是它们都含有相同数目的元音（’a’，&#…

人工智能 2023年6月29日
0048
Neo4j社区版环境搭建

Neo4j安装和配置 Neo4j安装包的获取 1）从Neo4j网站下载Neo4j Server安装文件： http://www.neo4j.org/download 2）为了配合之…

人工智能 2023年6月4日
0082
Java校园语音通信软件开发

随着通信技术的进步，利用网络进行语音通信已日益成熟和普及。网络的语音通信具有成本低、通信质量高的特点，在很多场景下已经取代了传统的语音通信手段。目前，软件市场上的网络语音通信软件种…

人工智能 2023年5月25日
0086

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

微信小程序-百度AI语音识别——（一）

一、百度AI

; 二、着手实现（开始踩坑）

1.接口鉴权

2.语音识别接口

三、实现demo（坑。。。🕳。。。）

四、第二期已更新——微信小程序实现

项目已经上传gitee

大家都在看