ROS机器人语音模块

2023年5月25日下午8:15 • 人工智能 • 阅读 87

ROS机器人语音模块

文章目录

*
– ROS机器人语音模块
–
+ 零乘骐骥以驰骋兮，来吾道夫先路
+ 壹路漫漫其修远兮，吾将上下而求索
+ 贰苟余情其信姱以练要兮，长顑颔亦何伤
+ 叁不吾知其亦已兮，苟余情其信芳
+ 肆虽体解吾犹未变兮，岂余心之可惩
+ 末亦余心之所善兮，虽九死其犹未悔

近期我参加了第十七届全国大学生智能汽车竞赛讯飞-家庭服务机器人挑战赛，目前我们队已经完成了场地搭建、环境配置，各传感器的功能也已验证完毕，接下来就是视觉代码编写以及ROS相关功能实现，其中就包括机器人语音功能，另外，互联网+比赛的机器人也需要实现语音功能。因此，实现ROS机器人语音功能的任务就落在了我的肩上。

目前，我找到了语音模块相关文档”环形六麦克风阵列开发者文档”，该文档用于描述科大讯飞环形六麦克风阵列的使用方法，覆盖语音唤醒、声源定位、语音获取、语音识别等应用的实现方式。废话不多说，直接开干咯！

零乘骐骥以驰骋兮，来吾道夫先路

麦克风阵列简介：

麦克风阵列是由一定数目的声学传感器（一般为麦克风）组成，对声场的空间特性进行采样并处理的系统。其主要作用有声源定位，抑制背景噪声、干扰、混响、回声，信号提取与分离。其中，声源定位是指利用麦克风阵列计算声源阵列的角度和距离，基于TDOA（Time Difference Of Arrival，到达时间差）实现对目标声源的跟踪；信号的提取与分离是指在期望方向上有效地形成一个波束，仅拾取波束内的信号，从而达到同时提取声源和抑制噪声的目的。
麦克风的一般使用流程：① 麦克风启动并进入工作状态 ② 设置麦克风的主麦方向，可唤醒或手动设置 ③ 获取降噪音频送入识别引擎进行识别和处理

【注：在麦克风阵列中，一般指定一个主麦来实现指定方向声音加强，其他方向抑制的目的，且降噪音频的获取也属于该主麦方向。若未主动设置主麦，主麦方向随机，则获取到的降噪音频不一定基于说话方向，此时生成的降噪音频可能不是最优的】

; 壹路漫漫其修远兮，吾将上下而求索

Linux-SDK：

本次智能车比赛所用麦克风阵列板载系统为Linux，用户可以使用任一搭载Linux系统的主机进行通信，主机与麦克风阵列之间的通信方式为基于USB的自定义通信协议。基于这些协议，用户可以在主机端进行诸如麦克风板开机、获取音频、设置主麦方向、获取唤醒角度等操作。为便于使用，本次比赛所用麦克风阵列配备SDK，主要对一些协议进行了API封装

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mBRPthll-1652716821228)(https://gitlab.com/Muscularmonk/project_01/uploads/aa51e6b68a79d573dab694dcb9a8f353/2.png)]

将sdk拷贝到系统任一目录，切换到该目录，可以看到 sdk-vvui 以及 ros 中对应的功能包集 vvui_ros-master。初次使用且未配置本麦克风的udev规则，则先完成如下操作：（注：xf_mic.rules位于根目录）

sudo cp xf_mic.rules /etc/udev/rules.d
sudo service udev restart

该SDK文件中 config 存放配置文件，其中 call.bnf 是用户自定义的离线命令词语法文件，可根据场景进行更改，且需要根据 bnf 语法规则来定义关键语料，需要先构建语法，再指定使用的语法
SDK集成方式：首先进入主机（搭载linux系统的PC或ARM板），将SDK拷贝到自定义的目录中，切换到该目录，执行以下命令，

tar xvf vvui.tar.gz
sudo apt-get install libasound2-dev
sudo apt-get install sox
sudo apt-get install mplayer

lsusb

贰苟余情其信姱以练要兮，长顑颔亦何伤

基础功能测试：

动态库配置：

cd ./vvui/lib

若主机是X64操作系统，则执行：

cd x64 && sudo cp lib* /usr/lib

若主机是arm64操作系统，则执行：

cd arm64 && sudo cp lib* /usr/lib

若主机是arm32操作系统，则执行：

cd arm32 && sudo cp lib* /usr/lib

生成可执行文件：

cd vvui/sample/mic_demo_sample

若主机是X64操作系统，则执行：

sh ./x64bit_make.sh

若主机是arm64操作系统，则执行：

sh ./arm64_make.sh

若主机是arm32操作系统，则执行：

sh ./arm32_make.sh

测试：

cd ../../bin
sudo ./mic_demo_sample

若运行完成，会提示”成功打开麦克风设备”，后面附有1-11命令

【注：由于时间和篇幅问题，离线命令词识别案例和在线人机交互案例不在此处记录，有需要的uu可以下载相关文档，自行查看】

叁不吾知其亦已兮，苟余情其信芳

麦克风相关 ROS接口使用步骤：

拷贝与编译：

将 vvui_ros-master 包放到任一ROS工作空间的src目录下，根据运行平台修改功能包的CmakeLists.txt文件，地址为 /工作空间名/src/vvui_ros-master，修改内容如下，若为Nvidia Jetson平台，则修改为 lib/arm64

link_directories(
    lix/x64
)

然后切换到该工作空间，直接 catkin_make，编译完成后，执行以下命令使工作空间生效：

echo "source ~/工作空间名/devel/setup.bash" >> ~/.bashrc
source ~/.bashrc

最后关闭所有终端

udev rules 检查：

sudo service udev restart

最后再插拔麦克风即可

肆虽体解吾犹未变兮，岂余心之可惩

首先在讯飞开放平台注册账号

然后点击右上角”控制台”

进入控制台后，如果是第一次使用，则控制台是空的，点击创建新应用

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-shBspENP-1652716821230)(https://gitlab.com/Muscularmonk/project_01/uploads/02b0e8f91058eb7ca45a1142ab87b5fb/5.png)]

提交后可以看到用户应用列表，选择刚创建的应用，进入应用配置界面。接着就可以下载sdk玩了。

【注：由于时间和篇幅问题，离线命令词识别和集成AIUI不在此处记录，有需要的uu可以下载相关文档，自行查看】

; 末亦余心之所善兮，虽九死其犹未悔

常见错误纠错与解决方法找不到麦克风设备系统未检测到麦克风启动后出现报红或segment fault字样检查是否配置麦克风udev规则启动后出现libcjson.so.1不存在需要安装 cjson，且将/usr/local/lib中的libcjson.so.1移动到/usr/lib下23300或bnf_recognise_error离线命令词识别时 bnf 语法有误，检查标点符号、槽定义等是否有误10407或unfit_appid_and_lib_errorappid与动态库 libmsc.so 不匹配10102或build_grammer_error离线命令词识别过程中，common.jet 资源文件路径有误，建议修改为绝对路径11210appid与离线资源 common.jet 不匹配11201在线业务超次数或离线资源装机量超限文件无法打开确认音频文件是否有读写权限启动例程时一直显示麦克风未启动检查是否有开启录音后未停止录音的操作。若有，则需手动停止录音或断开与麦克风的连接

Original: https://blog.csdn.net/MuscleMonk/article/details/124811062
Author: monk_闲来垂钓
Title: ROS机器人语音模块

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/515894/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

高斯分布&正态分布

文章目录 0 高斯分布定义 1 高斯分布意义 2 高斯分布的概率密度函数推导高斯分布又叫正态分布，是统计学中最重要的连续概率分布。有的地方将正态分布也称为常态分布，什么意思呢？从…

人工智能 2023年7月27日
0061
【论文笔记】（Corr 2022） Knowledge Graph Embedding Methods for Entity Alignment: An Experimental Review

Knowledge Graph Embedding Methods for Entity Alignment: An Experimental Review 原文代码 1 Intr…

人工智能 2023年6月10日
00111
1. 获取数据-requests.get()

1、爬虫的工作原理获取数据–解析数据–提取数据–存储数据 2、获取数据本质就是通过URL去向服务器发出请求，服务器再把相关内容封装成一个Re…

人工智能 2023年7月5日
00122
Android OpenCV（七十）：Android DNN 部署深度学习模型

### 回答1： _opencv_中的mat::zeros函数是用来创建一个指定大小和类型的全零矩阵的函数。它的语法如下： cv::Mat cv::Mat::zeros(int r…

人工智能 2023年7月18日
0076
Linux操作系统5：用户和组的管理

Linux操作系统5：用户和组的管理一、实验目的：二、实验内容：三、实验结果： * （1）用户的管理（2）组的管理一、实验目的：掌握Linux系统下利用命令方式实现用户…

人工智能 2023年6月29日
0077
全新中国交通标志检测数据集2021—CCTSDB 2021: A More Comprehensive Traffic SignDetection Benchmark（全新分类-多算法测评）

CCTSDB 2021 重磅发布！全新数据集！全新分类！多种算法测评！欢迎大家使用！数据集发布网址：GitHub – csust7zhangjm/CCTSDB20…

人工智能 2023年6月30日
0098
卸载opencv 安装cuda版本的opencv

第一推荐 https: 一、卸载opencv （如果没装那直接跳过这一步）1、查看已安装的 opencv 版本pkg-config –modversion opencv…

人工智能 2023年7月18日
0061
GO FOR A WALK AND ARRIVE AT THE ANSWER: REASONING OVER PATHS IN KNOWLEDGE BASES USING REINFORCEMENT

MINERVA:使用强化学习对知识库中的路径进行推理摘要自动和手动构建的知识库 (KB) 通常是不完整的——通过综合现有信息可以从 KB 中推断出许多有效的事实。知识库补全的一…

人工智能 2023年6月10日
0078
RuntimeError: cuDNN error: CUDNN_STATUS_NOT_INITIALIZED 问题解决记录

在运行 PyTorch 代码时遇到以下 Bug： /opt/conda/conda-bld/pytorch_1634272128894/work/aten/src/ATen/nat…

人工智能 2023年7月22日
0066
Pandas这一篇就够了（建议收藏）

前言：pandas主要分为两大块，Series和datafram，下面对这两块分别进行总结。其次，在看该篇文章时候，需有一点numpy的知识，后面我都会将其类型转换的numpy的数…

人工智能 2023年7月7日
0086
Rotated_Faster_Rcnn

rotated faster rcnn 文章目录训练 * rpn_head.forward_train – rpn_head.forward rpn_head.los…

人工智能 2023年7月10日
00122
ArcGIS与地理加权回归GWR【一】

公众号原文 ArcGIS与地理加权回归GWR【一】https://mp.weixin.qq.com/s/fMPYxO3G7ff2192ZQICN-A ; 开个新坑啊，写一写关于地理…

人工智能 2023年6月16日
0091
深度学习——损失函数、正则化参数、优化器

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月16日
0061
3D-SIS: 3D Semantic Instance Segmentation of RGB-D Scans学习总结

概述：这篇文章的介绍了一个3D-SIS的新颖卷积神经网络用来对商品的RGB-D扫描图像进行语义实例分割。序言：他们将每个图像中的每个像素通过2D卷积提取特征图谱，之后将结果反投影…

人工智能 2023年6月10日
0088
Yolov5+Deepsort多目标追踪，支持显示目标类别

Yolov5+Deepsort多目标追踪，支持显示目标类别本文禁止转载! 项目简介：代码地址（欢迎star）： YOLOv5检测器： DeepSort追踪器：运行demo： …

人工智能 2023年5月26日
0078
openCV第三篇

前文复习： openCV第一篇_老师我作业忘带了的博客-CSDN博客 openCV第二篇_老师我作业忘带了的博客-CSDN博客文章目录一、Canny边缘检测二、图像轮廓 2…

人工智能 2023年6月23日
00108

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

ROS机器人语音模块

ROS机器人语音模块

文章目录

零 乘骐骥以驰骋兮，来吾道夫先路

; 壹 路漫漫其修远兮，吾将上下而求索

贰 苟余情其信姱以练要兮，长顑颔亦何伤

叁 不吾知其亦已兮，苟余情其信芳

肆 虽体解吾犹未变兮，岂余心之可惩

; 末 亦余心之所善兮，虽九死其犹未悔

大家都在看

零乘骐骥以驰骋兮，来吾道夫先路

; 壹路漫漫其修远兮，吾将上下而求索

贰苟余情其信姱以练要兮，长顑颔亦何伤

叁不吾知其亦已兮，苟余情其信芳

肆虽体解吾犹未变兮，岂余心之可惩

; 末亦余心之所善兮，虽九死其犹未悔