pocketSphinx Android 离线语音识别

2023年6月26日上午1:03 • 人工智能 • 阅读 107

前几天有个朋友找到我说是否有非第三方(讯飞、百度)的语音识别方案，之前对这块的了解是语音识别基本都是调用这种第三方的方案。听完之后，谷歌发下有两种方案。

调用Android本地

具体就是使用原生的SpeechRecognizer来调用，但是这种目前的国内环境是需要修改的，但是不能保证修改后各个机型是否能够使用，按照这种方法，试了在小米手机上，基本是无法识别的，具体可以看下这篇文章的介绍：
https://juejin.cn/post/6844903861405089799

使用开源的pocketSphinx方案

在github上发现pocketSphinx可以满足目前的要求，开源地址：

由于是在android 设备上运行的，所以可以直接使用Android开源方案：

按照这个教程添加依赖库

dependencies {
    implementation 'edu.cmu.pocketsphinx.android:pocketsphinx-android:5prealpha@aar'
}

dependencies {
    compile (name:'pocketsphinx-android-debug', ext:'aar')
}

repositories {
    flatDir {
        dirs 'libs'
    }
}

或者也可以参考github上给出的 Android demo

由于是使用离线的方案，所以需要我们先训练好字典的模型，生成需要的语音模型，访问这个网址点击选择文件，选择刚才编写的命令集文件 command.txt，然后点击COMPILE KNOWLEDGE BASE按钮就可以生成语言模型，如图：

这里生成了好几个文件，我们可以把整个 .tgz 文件下载下来解压缩，其中得到的 .lm 文件就是我们需要的语言模型。

语言模型在这一步已经完成了，接下来需要添加字典模型，在这个网址下载我们需要的模型：
解压后，里面有一个.dic文件,然后参考这个 .dic 文件的格式，在上一步获取到的 .lm 语言模型文件中还有一个 .dic 文件，补充完整这个 .dic 文件的发音，如图所示：

字典模型就这样完成了，接下来添加声学模型

同样是在资源网盘的 Mandarin 文件夹下，下载 .tar.bz2 的压缩文件解压后，得到如下声学模型文件：

按照一般的流程，到这里，再根据文档，就可以完成了，但是在开发的过程中发现按照以上方法，运行都是报错的。
目前官网的字典模型是

该版本是比较新的，另外训练好的语音模型，在官网的demo版本中没有看到是在那个地方加载，基于这两个疑问，试了很多次，发现都不知道怎么解决，后面看到一个 pocketSphinx 旧的版本的使用方法，

按照这个教程和对应的开源代码：
发现里面有使用到 .lm 文件的训练好的模型，然后根据上面提到的，训练了对应的关键字语音模型，发现还是无法识别，最后通过反复对比，发现是使用的字典模型版本不一致导致的。

于是使用了 PocketSphinx 0.7 版本的字典模型，解压后在pocketsphinx-0.7\model\lm\zh_CN/mandarin_notone.dic 去找实际的拼音，然后运行发现能够正常的识别出来，完美解决了。

Original: https://blog.csdn.net/linhaosheng123456/article/details/124822535
Author: linhaosheng123456
Title: pocketSphinx Android 离线语音识别

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/651864/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

opencv4.5.5+qt5.15.2+vtk9.1+mingw81_64编译记录

目录一 VTK编译二无opencv_contrib编译记录三有opencv_contrib编译记录四参考链接 mingw编译器针对很多仓库代码没有编译错误，适配min…

人工智能 2023年7月20日
0081
【经典永不过时】数据分析网红级别的项目案例分享【超详细】

大家早上好，本人姓吴，如果觉得文章写得还行的话也可以叫我吴老师。欢迎大家跟我一起走进数据分析的世界，一起学习！本周给大家分享的数据分析案例是泰坦尼克号幸存者预测的项目，没记错的话…

人工智能 2023年7月5日
0057
知识图谱–知识抽取–使用D2R将关系型数据库mysql中的数据转换为RDF形式，并使用protege查看

此次数据库版本：mysql 8 官方提供暂时只支持mysql 5 java 1.8 第一步：创建mysql表格第二步：拥有工具，并放在英文路径。工具下载链接（包文件已安家） h…

人工智能 2023年6月1日
0067
PAconv环境配置：build.ninja缺少lib的解决+error LNK2019: 无法解析的外部符号

1.背景最近跑PAconv项目，电脑上有版本匹配的cl.exe，但是仍然报错 Error checking compiler version for cl: [WinError …

人工智能 2023年5月25日
0086
VIT中特殊class token的一些问题

类似于BERT中的[class] token,ViT引入了class token机制，其目的：因为transformer输入为一系列的patch embedding，输出也是同样长…

人工智能 2023年6月24日
0076
笔记篇二：鸢尾花数据集分类

目录一、鸢尾花数据集二、逻辑回归分析三、逻辑回归实现鸢尾花数据集分类四、散点图绘制一、鸢尾花数据集 1、问题 Iris 鸢尾花数据集是一个经典数据集，在统计学习和机器学习…

人工智能 2023年6月19日
0073
基于SPSS的聚类分析原理概述

文章目录 1. 聚类分析的基本概念 * 1.1 方法概述 1.2 聚类方法 2. 系统聚类 * 2.1系统聚类的类型 2.2 两个距离概念 2.3亲疏程度的度量 – 2…

人工智能 2023年6月19日
0083
transformer学习之位置编码

参考原文➡️Transformer Architecture: The Positional Encoding 文章目录 * – + 题目 + * 位置编码（POSIT…

人工智能 2023年7月14日
0075
SpringBoot整合JPA+SQLite

文章目录背景介绍 SQLite安装以及生成db库创建SpringBoot项目 * POM文件所需要的依赖配置数据源配置JAP 测试效果 * 创建pojo类创建Reposi…

人工智能 2023年6月26日
00122
数字图像处理实验四邻域平均法滤波处理和差分法求图像边缘

邻域平均法使用下面的模板进行邻域平均法滤波处理1 9 [ 1 1 1 1 1 ∗ 1 1 1 1 ] \frac19 \begin{bmatrix} 1 & 1 &amp…

人工智能 2023年6月22日
0068
如何使用opencv检测二维码和条形码

我们将学习如何使用opencv检测图像中的QR码和条形码，我们首先了解一下基础知识，然后我们将继续创建一个身份验证项目，在该项目中，根据上的QR码检查人是否被授权或未经授权。在p…

人工智能 2023年5月28日
0070
【python】matplotlib 实现双（多）Y轴图

【python】matplotlib 实现双（多）Y轴图先来点简单的两个Y轴三个以及多个Y轴来亿点点美化先来点简单的先来个最简单的画图，比如一个 y = s i n (…

人工智能 2023年7月5日
00150
速通Anaconda+Pycharm+Tensorflow-GPU+CUDA+CUDNN的安装

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月24日
0084
2021年最完整的人工智能入门指南

这可能是一份中英文世界最好的人工智能学习教程，在充分考虑大家信息获取难度的情况下制定了帮助你掌握人工智能（AI）和机器学习（ML）的完整指南：无需专业背景！无需学费！无需额外的时…

人工智能 2023年7月16日
0062
灰色预测模型怎么分析？

一、应用灰色预测模型可针对数量非常少（比如仅4个），数据完整性和可靠性较低的数据序列进行有效预测，其利用微分方程来充分挖掘数据的本质，建模所需信息少，精度较高，运算简便，易于检验…

人工智能 2023年7月18日
0054
[PyTorch]利用torch.nn实现前馈神经网络

文章目录前馈神经网络实验要求一、利用torch.nn实现前馈神经网络二、对比三种不同的激活函数的实验结果三、使用不同的隐藏层层数和隐藏单元个数，对比实验结果 * 3.1 …

人工智能 2023年7月22日
0054

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

pocketSphinx Android 离线语音识别

调用Android本地

使用开源的pocketSphinx方案

大家都在看