Python语音识别基础实践-SpeechRecognition

2023年5月27日下午12:40 • 人工智能 • 阅读 103

声明：参考B站视频，自学成长记录

并参考博客：https://blog.csdn.net/Datapad/article/details/82970253

安装SpeechRecognition

C:\Users\Administrator>pip3 install SpeechRecognition
......

Installing collected packages: SpeechRecognition
Successfully installed SpeechRecognition-3.8.1

安装成功入下图

安装pocketsphinx

C:\Users\Administrator>pip install pocketsphinx
......

Installing collected packages: pocketsphinx
Successfully installed pocketsphinx-0.1.15

安装成功入下图

代码示例

实现将wav格式的语音文件读取并进行整体 / 部分识别

import speech_recognition as sr

r = sr.Recognizer()
harvard = sr.AudioFile('E:\speek\harvard.wav')

with harvard as source:
    all_audio = r.record(source)

print(type(all_audio))

all_text = r.recognize_sphinx(all_audio)
print(all_text)

with harvard as source:

    audio = r.record(source, offset=4, duration=3)

text = r.recognize_sphinx(audio)
print(text)

注意事项

1、预先知道音频文件中语音的结构，那么offset和duration关键字参数对于分割音频文件非常有用。然而，匆忙使用它们会导致转录不良
2、音频文件类型以PCM WAV、AIFF/AIFF- c或本机FLAC读取音频文件，不然会报错
3、声音文件链接：https://pan.baidu.com/s/10oClt_NWgjOsDmIPuqQGzg 提取码：0wv4

Original: https://blog.csdn.net/BuLingLings/article/details/109510391
Author: BuLingLings
Title: Python语音识别基础实践-SpeechRecognition

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/526168/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【python数据分析】数据的分组，遍历，统计

数据的分组，遍历，统计俗话说：”人与类聚，物以群分”，到这里我们将学习数据的分组以及分组后统计。Pandas的分组相对于Excel会更加简单和灵活。 1️…

人工智能 2023年6月19日
0088
【行空板教程】手写输入法

; 前言前些日子看到群里有老师说：行空板如果做文字键盘输入比较复杂。在之前我们的信息输入大多数用语音识别来完成的，我就想能不能像手机输入法里的手写字输入法那样：我在屏幕手写字体，…

人工智能 2023年5月27日
0061
使用 Temporal Fusion Transformer 进行时间序列预测

目前来看表格类的数据的处理还是树型的结构占据了主导地位。但是在时间序列预测中，深度学习神经网络是有可能超越传统技术的。为什么需要更加现代的时间序列模型？专为单个时间序列（无论是…

人工智能 2023年7月28日
0087
matlab模拟池化过程

matlab模拟池化过程前言池化定义（最大池化的个人理解） matlab模拟前言本文是关于我对于池化的个人理解，以及在matlab中做出的图片可视化模拟。也是我在深度学习开…

人工智能 2023年6月20日
0080
OpenMV：18数字识别

Lenet是一种卷积神经网络，可以用来识别打印的、手写的数字我们之前就有讲到过利用 OpenMV的NCC模板匹配算法来进行数字识别，模板匹配需要我们实现保存需要匹配的数字或者字母…

人工智能 2023年5月23日
00106
resnet18实现cifar10分类

实验步骤搭建resnet18网络数据集加载模型训练和改进分析评估 Kaggle提交网络构建实验初期拟采用torchvision中实现的resnet18作为网络结构，为了…

人工智能 2023年7月21日
0052
Python实现的数字图象处理之阴影检测与去除

资源下载地址：https://download.csdn.net/download/sheziqiong/85884481资源下载地址：https://download.csdn….

人工智能 2023年6月24日
0092
windows中labelme安装教程

1.labelme是什么 2.详细安装教程 1.labelme是什么 labelme是图形图像注释工具，它是用Python编写的，其实就是标注去软件， 2.详细安装教程① 参考链接…

人工智能 2023年7月26日
0066
TensorRT 开始

TensorRT 是 NVIDIA 自家的高性能推理库，其 Getting Started 列出了各资料入口，如下：本文基于当前的 TensorRT 8.2 版本，将一步步介绍从…

人工智能 2023年6月4日
00105
AI听曲识歌！哼曲、口哨吹，都能秒识！ ⛵

💡 作者：韩信子@ShowMeAI📘 深度学习实战系列：https://www.showmeai.tech/tutorials/42📘 自然语言处理实战系列：https://www…

人工智能 2023年6月4日
00161
「原创」大数据岗位总结和相关书籍推荐

作者：数据一哥来源：数据社全文共3547个字，建议 10分钟阅读大家好，我是一哥。最近有几个群友问我大数据怎么入门，作为一个零基础大数据入门学习者该看哪些书呢？我结合自己…

人工智能 2023年7月17日
0098
工作5年后我才发现：90%的技术问题，可以解决

; 01.前言现在市面上的智能电子产品千千万，为了达到人们使用更加方便的目的，很多智能产品都开发了语音识别功能，用来语音唤醒进行交互；另外，各大公司也开发出来了各种智能语音机器人…

人工智能 2023年5月25日
0063
ABB机器人：工件坐标系介绍以及标定操作与使用方法

目录工件坐标系介绍机器人工作站创建工件坐标系标定方法工件坐标系手动测试工件坐标系应用仿真运行工件坐标系介绍工件坐标系对应工件：它定义工件相对于大地坐标系（或其它坐标…

人工智能 2023年6月27日
00166
DataFrame中的空值处理

数据清洗是一项复杂且繁琐的工作，同时也是整个数据分析过程中最为重要的环节。在python中空值被显示为NaN。首先，我们要构造一个包含NaN的DataFrame对象。删除NaN…

人工智能 2023年6月2日
0083
linux|奇怪的知识—linux权限管理之数字权限和字母权限

linux的权限管理是比较复杂的，主要原因是linux系统是一个多用户的并且是一个多种权限的权限系统。以上这些构成了Linux系统的完整的权限系统。例如我们查看一个文件，ls …

人工智能 2023年6月29日
0097
【opencv】(8) 傅里叶变换，高通低通滤波器

图像处理一般分为空间域处理和频率域处理。空间域处理是直接对图像内的像素进行处理。主要划分为灰度变换核空间滤波两种形式，灰度变换对图像内的单个像素进行处理，滤波处理涉及对图像质量的…

人工智能 2023年6月18日
00118

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Python语音识别基础实践-SpeechRecognition

大家都在看