【语音识别入门】Python音频处理示例（含完整代码）

2023年8月2日上午1:11 • Python • 阅读 42

一、读取本地音频数据

首先，需要import几个工具包，一个是python标准库中的 wave模块，用于音频处理操作， nump和 matplot提供数据处理函数。

import wave

import matplotlib.pyplot as plt

import numpy as np

import os

f = wave.open(r"audio06.wav",'rb')

params = f.getparams()
nchannels ,sampwidth ,framerate ,nframes = params [:4]
print(framerate)

二、读取单通道音频，并绘制波形图（常见音频为左右两个声道）

（1）通过第一步，可以继续读取音频数据本身，保存为字符串格式

readframes：读取声音数据，传递一个参数指定需要读取的长度（以取样点为单位），readframes返回的是 二进制数据（一大堆bytes)，在Python中用 字符串表示二进制数据。

strData = f.readframes(nframes)

（2）如果需要绘制波形图，则需要将字符串格式的音频数据转化为 int 类型

frombuffer：根据声道数和量化单位，将读取的 二进制数据转换为一个可以计算的数组,通过frombuffer函数将二进制转换为整型数组，通过其参数dtype指定转换后的数据格式。

waveData=np.frombuffer(strData,dtype=np.int16)

此处需要使用到 numpy 进行数据格式的转化

（3）将幅值归一化

把数据变成（０，１）之间的小数。主要是为了数据处理方便提出来的，把数据映射到0～1范围之内处理，更加便捷快速。

waveData=waveData*1.0/(max(abs(waveData)))

这一步去掉也可画出波形图，可以尝试不用此步，找出波形图的不同

（4）绘制图像

通过取样点数和取样频率计算出取样的时间：

time = np.arange(0,nframes)*(1.0/framerate)

（5）完整代码

import wave

import matplotlib.pyplot as plt

import numpy as np

import os

f = wave.open(r"audio06.wav",'rb')

params = f.getparams()
nchannels ,sampwidth ,framerate ,nframes = params [:4]
print(framerate)

strData = f.readframes(nframes)

waveDate = np.frombuffer(strData,dtype=np.int16)

waveDate = waveDate*1.0/(max(abs(waveDate)))

time = np.arange(0,nframes)*(1.0/framerate)

plt.plot(time,waveDate)
plt.xlabel("Time(s")
plt.ylabel("Amplitude")
plt.title("Single channel wavedata")
plt.show()

Original: https://blog.csdn.net/weixin_51293984/article/details/126667498
Author: 一个很菜的小猪
Title: 【语音识别入门】Python音频处理示例（含完整代码）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/729481/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

java入门（5）–数组

数组是复合类型数组是复合类型，内建的复合类型。它与字符串同属于”类–对象”范畴，有着与”基本类型”很不同的行为和特性。…

Python 2023年6月6日
0066
pythonpandas读取txt文件_python pandas：尝试读取txt文件，但显示NaN

我认为您需要sep参数，因为默认值是sep=’,’。在如果tab：names=[‘t[s]’,’digits[]&#8…

Python 2023年8月8日
0059
Python笔记之 Flask模块简介

Flask是Python一个轻量级的Web应用框架，适合一些分层比较少,开发成本低，逻辑不怎么复杂的web项目。pip下载Flask包后，再使用pycharm创建项目时选择flas…

Python 2023年8月12日
0051
docker搭建yapi接口文档系统、Idea中上传接口、在线调用

一、前言在我们后端开发中，必不可少的是接口的交接，有很多种方式，常见的就是 swagger，不过这个侵入性太强了。还有就是接口文档的框架，比如今天小编带大家一起搭建的 yapi，…

Python 2023年10月19日
0059
Numpy学习笔记-Numpy的知识点总结

Numpy学习笔记 * – 一、概述 – 二、Numpy简介 – 三、Numpy的安装和调用 – 四、Numpy的数据类型 &#82…

Python 2023年8月26日
0056
机器学习——numpy

一、numpy概述 numpy用于快速处理任意维度的数组，主要来说就是对矩阵操作。 numpy是使用 ndarray对象来处理多维数组，该对象是一个快速而灵活的大数据容器。 …

Python 2023年8月29日
0050
[机器学习]-分类问题常用评价指标、混淆矩阵及ROC曲线绘制方法-python实现（多分类）

分类问题分类问题是人工智能领域中最常见的一类问题之一，掌握合适的评价指标，对模型进行恰当的评价，是至关重要的。同样地，分割问题是像素级别的分类，除了mAcc、mIoU之外，也可…

Python 2023年10月29日
0049
[大数据]数据可视化 — 练习卷（上）

一、填空题 1 ．反映发展趋势的可视化图表有 _____ ______ 、 _____ _ 和 ____ ___ 。 2 ． ____ _ ______ 是指发现并纠正数据文件中可…

Python 2023年8月1日
00140
fillna()函数

作用：补充缺失值参数：fillna(inplace,method,limit,axis) 参数解释+代码演示自定义DataFrame类型的数据 1、inplace参数的取值： …

Python 2023年8月18日
0068
VSCode远程连接服务器显示图像

主要是为了在远程服务器的python中，使用matplotlib和opencv的imshow显示图像，配置好后也可以使用远程服务器的其它图形化界面，gedit之类的。以下文字内 …

Python 2023年8月31日
00316
数据预处理：缺失值处理

【小白从小学Python、C、Java】【Python全国计算机等级考试】【Python数据分析考试必会题】 ● 标题与摘要 Python数据分析中的数据预处理：缺失值处理 …

Python 2023年8月20日
0080
Python中list(列表)和ndarray对象的相互转换

列表是Python的基本数据类型，ndarray是Numpy库的最重要对象。二者在Python编程中都是很常用的，所以有必要了解下它们之间如何相互转换。两个咱们都会用到，它们都可…

Python 2023年8月1日
0069
Python 这几种方法进行机器学习特征筛选，有效提升模型性能

大家好，今天我来说说如何对数据集进行特征筛选，有时候我们拿到的数据集是非常庞大的，但模型其实真的不需要这么多的数据，减少冗余的数据必不可少，这样可以带来很多的好处，例如提高预测的…

Python 2023年8月8日
0083
贪心算法篇——区间问题

本次我们介绍贪心算法篇的区间问题，我们会从下面几个角度来介绍：区间选点区间分组区间覆盖区间选点我们首先来介绍第一道题目： /*题目名称*/ 区间选点 /*题目介绍*/ 给…

Python 2023年10月14日
0050
python手柄pygame joystick文档

python手柄pygame joystick文档安装pygame python3 -m pip install -U pygame –user python3 -m…

Python 2023年9月21日
0040
地图要素增删改服务WFS: Openlayer+GeoServer+GeoPackage

前端：Openlayer 后台：GeoServer 数据库：GeoPackage 工具：QGIS 一个完整的地图服务DEMO todo: 待更新 posted @2021-04-0…

Python 2023年6月3日
00101

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

【语音识别入门】Python音频处理示例（含完整代码）

一、读取本地音频数据

二、读取单通道音频，并绘制波形图（常见音频为左右两个声道）

（1） 通过第一步，可以继续读取音频数据本身，保存为字符串格式

（2） 如果需要绘制波形图，则需要将字符串格式的音频数据转化为 int 类型

（3） 将幅值归一化

（4） 绘制图像

（5）完整代码

大家都在看

（1）通过第一步，可以继续读取音频数据本身，保存为字符串格式

（2）如果需要绘制波形图，则需要将字符串格式的音频数据转化为 int 类型

（3）将幅值归一化

（4）绘制图像