教程 | 如何使用TensorFlow实现音频分类任务

2023年5月27日上午11:52 • 人工智能 • 阅读 49

本文介绍了一种使用 TensorFlow 将音频进行分类（包括种类、场景等）的实现方案，包括备选模型、备选数据集、数据集准备、模型训练、结果提取等都有详细的引导，特别是作者还介绍了如何实现 web 接口并集成 IoT。

有很多不同的项目和服务能够识别人类的语音，例如 Pocketsphinx、Google』s Speech API，等等。这些应用和服务能够以相当好的性能将人类的语音识别成文本，但是其中却没有一个能够分得清麦克风捕捉到的是哪一种声音：人声、动物声音或者音乐演奏声。

我们面临这个任务的时候，就决定去调研一下，并开发一个能够使用机器学习算法来区分声音的示例项目。这篇文章具体描述了我们选择哪款工具、我们面临的挑战是什么、我们如何用 TensorFlow 训练模型，以及如何运行我们的开源项目。为了把它们用在给第三方应用提供的云服务上，我们还在 DeviceHive 和 IoT 平台上提供了识别结果。

选择工具和分类模型

首先我们需要选择一些能够运行神经网络的软件。我们发现的第一个合适的解决方案是 Python Audio Analysis。

机器学习中的主要问题是要有一个好的训练数据集。对于音乐分类和语音识别而言，有很多数据集，但是并没有多少数据集是用来做随机声音分类的。经过调查，我们发现了 urban sound dataset（https://serv.cusp.nyu.edu/projects/urbansounddataset/）这个数据集。

经过一些测试，我们面临着以下问题：

[En]

After some testing, we are faced with the following problems:

pyAudioAnalysis 不够灵活。它的参数种类参数太少，并且一些参数的计算是不受控制的，例如&

Original: https://blog.csdn.net/update7/article/details/110294338
Author: code_kd
Title: 教程 | 如何使用TensorFlow实现音频分类任务

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/525953/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

MPC（模型预测控制）控制小车沿轨迹移动——C++实现

任务说明要求如下图所示，给定一条轨迹，要求控制小车沿这条轨迹移动，同时可以适用于系统带有延时的情况。注意，本篇文章只给出部分C++代码参考。主要流程首先用运动学自行车模型（K…

人工智能 2023年6月24日
0079
HRNet 【demo 复现过程】

HRNet 是一篇非常经典的关于2D 人体姿势检测的论文，昨天把demo跑通了，记录一下复现过程。论文题目： Deep High-Resolution Representatio…

人工智能 2023年7月22日
0056
【GPU加速】安装pycuda异常：Failed to build pycuda ERROR: Could not build wheels for pycuda, which is requir

异常：ERROR: Could not build wheels for pycuda, which is required to install pyproject.toml-b…

人工智能 2023年7月6日
0055
神经网络回归任务——关于预测目标是是较小以及较大数量级,loss为nan的解决办法

关于预测标签是是较小数量级时的解决办法:我恰恰碰上这种极端的情况，双输出，一个标签范围大概是个位数到几百，一个标签范围则是1e-3-1e-2左右。神经网络输出是loss nan. …

人工智能 2023年6月17日
00114
论文阅读：Face-Mic: Inferring Live Speech and Speaker Identity via Subtle Facial Dynamics Captured by

Face-Mic:通过AR/VR运动传感器捕捉的细微面部动态来推断实时语音和说话人身份 i. 文章目录 * Abstract 1 INTRODUCTION 2 PRELIMINAR…

人工智能 2023年5月23日
00101
数据库课程设计(学校运动会管理系统)2021-9-21

数据库课程设计(学校运动会管理系统) 1.需求分析1.1功能性需求分析由于现在无论是大学，中学，以及小学都会举办运动会，而对运动会的参赛过程可能不是很好地去管理，因此这个系统会更方…

人工智能 2023年6月1日
0096
python报错ValueError: Must pass 2-d input. shape=(5, 1, 10)解决方案

1.承接上一篇博文，上文提到append（）函数中的参数ignore_index=True，如果加上该参数，是a.append（b，ignore_index=True)，数据不支持…

人工智能 2023年7月6日
00131
大规模1.4亿中文知识图谱数据ownthink开源了

项目地址：https://github.com/ownthink/KnowledgeGraphData 本次ownthink开源了史上最大规模的中文知识图谱，数据是以（实体、属性、…

人工智能 2023年6月1日
0074
强人工智能指人可能会被人工智能取代或者会被人工智能威胁

而所谓强人工智能指的是未来有一天我们的生活当中充斥着大量的人工智能人可能会被人工智能取代或者会被人工智能威胁等我觉得这些未来也许会出现但可能不是我们现阶段作为科研工作者去考虑的。 …

人工智能 2023年6月5日
00102
机器学习强基计划0-3：数据集核心知识串讲，构造方法解析

目录 0 写在前面 1 数据集是什么？ 2 真相与泛化性 3 数据集的分类 4 数据集的构造方法 * 4.1 留出法 4.2 k k k 折交叉验证 4.3 自助法 ; 0 写在前…

人工智能 2023年7月26日
0053
Stata的负二项回归与零膨胀回归命令

负二项回归 nbreg nbreg – Negative binomial regression nbreg depvar [indepvars] [if] [in] [weigh…

人工智能 2023年6月16日
0085
Apriori算法进行关联分析

1.创建DataFrame对象传入数据可以是字典和嵌套列表。字典的创建为DataFrame对象的列名，值为数据列表元素作为DataFrame对象的行数据显示，从0开始pd.Data…

人工智能 2023年7月8日
00100
OpenImages V6下载

新工具：Fiftyone 网址可以采用colab运行程序，点击即可：完整代码： !pip install opencv-python-headless==4.5.4.60 !pi…

人工智能 2023年7月10日
0070
Pandas库的学习

pandas是数据处理最常用的分析库之一，可以读取各种各样格式的数据文件，一般输出dataframe格式。如：txt、csv、excel、json、剪切板、数据库、html、hdf…

人工智能 2023年6月15日
0041
机器学习初学者不可错过的ModelScope开源模型社区

文章目录 ModelScope开源模型社区 * 快速入门及环境安装模型库下载数据集达摩卡通化模型 * 模型介绍下载模型文件快速入手达摩人像抠图 * 在线抠图本地抠图 …

人工智能 2023年7月4日
00116
Python操作数据库基本操作-sqlalchemy

使用sqlalchemy，不仅要安装sqlalchemy库，还要安装pymysql 连接数据库很简单，使用一行简短的程序即可 from sqlalchemy import crea…

人工智能 2023年6月4日
0080

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

教程 | 如何使用TensorFlow实现音频分类任务

大家都在看