睡眠音频分割及识别问题(四)–YAMNet简介

2023年5月25日上午7:25 • 人工智能 • 阅读 81

简介

YAMNet模型是在 AudioSet 数据集（一个大型音频、视频数据集）上训练的音频事件分类器。

模型输入

该模型接收包含任意长度波形的float32一维张量或 NumPy数组，且满足范围[-1.0, +1.0]内的单声道16kHz样本。在内部，该算法将波形划分为长度为0.96秒和跳跃0.48秒的滑动窗口，然后在一批这些帧上运行模型。

模型输出

该模型返回一个 3 元组（scores, embeddings, log_mel_spectrogram），其中
（1）Scores是一个float32的形状为（N, 521）的张量，N为批大小，521列代表521个对应声音事件的评分。
（2）Embeddings是一个float32的形状为（N, 1024）的张量，这个张量是模型最后的全链接神经网络前的平均池化层输出，我们可以把YAMNet当做一个特征提取器（Embedding）来构建其他模型。
（3）log_mel_spectrogram是一个float32的形状为（num_spectrogram_frames, 64）的张量，其中num_spectrogram_frames是通过滑动长度为 0.025 秒的频谱图分析窗口以 0.01 秒的跳跃从波形产生的帧数。

模型使用

该模型提供了三种使用场景。

[En]

The model provides three usage scenarios.

（1）在python中直接通过tensorflow_hub插件使用，可以直接通过调用API的方式使用。
model = hub.load(‘https://tfhub.dev/google/yamnet/1’)
可以直接在python代码中通过该语句直接加载模型。
（2）在Tensorflow的JS版本中使用
const modelUrl = ‘https://tfhub.dev/google/tfjs-model/yamnet/tfjs/1’;
const model = await tf.loadGraphModel(modelUrl, { fromTFHub: true });
可以在通过使用JavaScript开源库TensorFlow.js来使用该模型
（3）在TFLite中使用
TFLite是为了将深度学习模型部署在移动端和嵌入式设备的工具包，可以把训练好的TF模型通过转化、部署和优化三个步骤，达到提升运算速度，减少内存、显存占用的效果。
TFlite主要由Converter（左）和Interpreter（右）组成。Converter负责把TensorFlow训练好的模型转化，并输出为.tflite文件（FlatBuffer格式）。转化的同时，还完成了对网络的优化，如量化。Interpreter则负责把.tflite部署到移动端，嵌入式（embedded linux device）和microcontroller，并高效地执行推理过程，同时提供API接口给Python，Objective-C，Swift，Java等多种语言。简单来说，Converter负责打包优化模型，Interpreter负责高效易用地执行推理。

此外，TFLite提供了 Java、Python 和 C++ API 库，可以运行在 Android、iOS 和 Raspberry Pi 等设备上。

; 参考文献

[1] https://discuss.tf.wiki/t/topic/1337

Original: https://blog.csdn.net/search_129_hr/article/details/118660529
Author: HenrySmale
Title: 睡眠音频分割及识别问题(四)–YAMNet简介

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/512890/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

分水岭算法–语义分割

分水岭算法–语义分割一、分水岭算法：把图像中的低密度的区域（变化小）看成山谷，高密度的区域（变化大）看成山峰。开始向山谷中注入水知道不同的山谷中的水开始汇聚。为了阻止不同山谷中的…

人工智能 2023年6月22日
0079
基于聚类的推荐算法笔记——以豆瓣电影为例(二）（附源代码）

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped …

人工智能 2023年6月3日
0077
理解回归_多元线性回归_最大似然函数_最大密度函数_标准差_方差_数据离散程度—人工智能工作笔记0020

然后我们再来看一下,对于之前我们说的,一元一次方程来说,在我们的现实世界中,往往是不能适用的,因为只考虑一个因素的话,那么太简单了,所以我们需要,考虑多个因素,这里就需要多元一次…

人工智能 2023年6月18日
0078
改进的YOLOv5：AF-FPN替换金字塔模块提升目标检测精度

关注并星标从此不迷路计算机视觉研究院公众号ID｜ ComputerVisionGzq 学习群｜扫码在主页获取加入方式源代码：https://arxiv.org/pdf/2…

人工智能 2023年7月9日
0082
为什么会出现梯度爆炸和梯度消失现象？怎么缓解这种现象的发生？

前言：梯度消失现象在深度神经网络训练过程中表现得尤为突出，随着网络层数的加深，损失在反向传播时梯度在不断减小，导致浅层网络的学习进行不下去，参数得不到有效更新。为什么会出现这种现象…

人工智能 2023年7月28日
0072
大数据概论

大数据概论高速发展的信息时代，新一轮科技革命和变革正在加速推进，技术创新日益成为重塑经济发展模式和促进经济增长的重要驱动力量，而大数据无疑是核心推动力。大数据不是一项专门的技…

人工智能 2023年6月19日
0067
详解：yolov5中推理时置信度，设置的conf和iou_thres具体含义

一、模型输出解析：设输出图片大小为1280，768，类别个数为2，则yolov5输出的三种特征图，其维度分别为：[1,3,96，160，7]，[1,3,48,80,7]，[1,3…

人工智能 2023年6月16日
0074
【CVPR2022】VizWiz-VQA Grounding Challenge冠军算法介绍–Aurora

一、简介之前从没接触过多模态方向，这次和在字节的师兄一起参加了一个VQA相关的比赛，发现基于图像-文本的预训练是一个很火热的领域，比如BLIP，LAVT等。在此基础上，针对VQA…

人工智能 2023年5月27日
0066
pcl实现三次B样条曲线拟合不规则圆并计算所得拟合曲线长度

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年5月28日
00109
DataFrame

1：获取dataFrame的行数和列数　　行数：dataframe.shape[0]或len(DataFrame.index)　　列数：dataframe.shape[1]或len…

人工智能 2023年6月2日
0082
Transformer 模型详解

本内容主要介绍 Transformer 模型的具体实现。 2017 年，Google 在论文 Attention is All you need 中提出了 Transformer …

人工智能 2023年6月16日
0087
【数学建模常用模型】分类专题

这次介绍一下数模国赛常用的分类方法，以下这方法也是现在应用比较广泛的分类方法：K-近邻算法（k-Nearest Neighbors，KNN）和支持向量机（Support Vecto…

人工智能 2023年7月1日
0082
树莓派4B使用NCNN部署Yolov5-lite

目录文章目录前言一、树莓派配置NCNN 1.安装依赖 2.下载NCNN并编译二、Yolov5-lite模型训练 1.源码地址 2.安装所需要的包 3.训练自己的数据集(YO…

人工智能 2023年6月17日
0095
3.yolov5目标检测-常用评估指标

yolov5官网的模型评估对比图需要借助狼来了的故事了解：真阳性，假阳性，假阴性，真阴性。 IOU：交并比，用来筛选最终预测出来的边界框。通过求标注和预测的交并比，可以得到一个…

人工智能 2023年5月26日
0068
推荐一款国产免费开源的ERP进销存系统附带安装详细教程

软件简介 ERP可用于自动化和简化整个企业或组织的各项活动，例如会计和采购、项目管理、生产管理、风险管理、合规性和供应链运营。 ERP全称Enterprise Resource P…

人工智能 2023年7月28日
00148
YOLOv5训练自己的数据集详解

入门小菜鸟，希望像做笔记记录自己学的东西，也希望能帮助到同样入门的人，更希望大佬们帮忙纠错啦~侵权立删。目录一、YOLOv5源码下载二、环境配置三、创建数据集四、更改配置…

人工智能 2023年6月16日
0070

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

睡眠音频分割及识别问题(四)–YAMNet简介

大家都在看