Espnet ASR Demo & Quantization Document

2023年5月25日上午6:47 • 人工智能 • 阅读 72

This is a document of how to run Espnet (v1) ASR Demo and its model quantization
Test enviroment:

UbuntuCUDAGCC21.0411.611.2

Note: Please follow the original installation guide provided by Espnet. Only some notes below should be paid attention to.

Requirements

soxsndfileffmpegflacinstalledinstallednot installednot installed

Install Kaldi

The Kaldi installation includes two parts: 1. tools installation 2. src installation. Make sure install them all in order
Once installed, many .o binary files can be found in directories such as: <kaldi-root>\{featbin,fgmmbin,fstbin,etc.}</kaldi-root>

Install Espnet

Kaldi should be linked into <espnet>/tools</espnet> (check guide)
Option A) Setup Anaconda environment is choosen in this document, so a virtual enviroment espnet is created with python==3.8
Since the current CUDA version is 11.6, which is not compatible with pytorch 1.10.1, so espnet should be installed by $ make TH_VERSION=1.10.1 CUDA_VERSION=11.3, which specifies the version pytorch and CUDA
Custom tools in [Optional] Custom tool installation are not installed
install chainer in the espnet conda enviroment by pip install chainer==6.0.0 (cupy is not installed due to some errors)

This demo is to decode (translate) .wav audio file into words

Notes: some

To quantize the model from FP32 to INT8

Espnet provides dynamic quantization method through pytorch API.

To enable dynamic quantization, add the following codes in espnet/utils/recog_wav.sh file line 248-249

        --quantize-asr-model True \
        --quantize-dtype "qint8" \

Now we can perform decoding as described in the last section

Original: https://blog.csdn.net/GLinttsd/article/details/123933717
Author: GLinttsd
Title: Espnet ASR Demo & Quantization Document

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/512741/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【Python爬虫】tensorflow + muggle_ocr最快的安装教程

1、安装Python 首先是得有python环境，这里可以自行安装python 3.8或者3.9 ，安装的时候要记得配置环境变量 https://www.python.org/do…

人工智能 2023年5月26日
00122
skywalking监控

3.在这里插入图片描述 ; 3.1 Skywalking架构 SkyWalking 逻辑上分为四部分: 探针, 平台后端, 存储和用户界面探针:用来采集app的请求，及服务请求第…

人工智能 2023年6月29日
0058
python ValueError: The number of FixedLocator locations(6), usually from a call to set_ticks, does

此为实验作业。实验内容见教材（《Python数据分析与挖掘实战》张良均等著（第一版，白色封面的那版））Page 178的实验一及实验二。 [TencentCloudSDKExce…

人工智能 2023年6月3日
0080
一道经典的Python数据分析笔试题

最近无意看到一份关于数据分析的Python笔试题，做起来还是很有意思的，特意自己动手做了一下，和大家分享一下，希望大家也可以跟着练习。题目如下：首先，模拟数据： importp…

人工智能 2023年7月7日
0070
Spring学习

入门案例建立Java工程，导入如下Java包。创建User类 public class User { public void add(){ System.out.println(…

人工智能 2023年6月4日
0083
色调映射（Tone Mapping）

一、概述虽然HDR 图像有较大的动态范围，能更细致地反映真实场景，但他的缺点也很明显。一是同尺寸的数据比低动态范围图像大，需要更大的存储空间与传输带宽。二是难以输出，目前大多数显…

人工智能 2023年6月20日
0046
Tensorflow2.x读取自定义数据集（图像分类）

最近在积攒粉丝500，大家帮帮忙，动动小手指关注、点赞、收藏…🙏🙏🙏🙏🙏🙏 一、说明在深度学习图像分类模型设计的数据集合中，通常包含训练集train set、验证集…

人工智能 2023年5月23日
0083
MySQL索引原理（标贝科技）

什么是索引？索引是帮助MySQL高效获取数据的数据结构。索引的本质就是数据结构。索引的目的在于提高查询效率，可以类比图书的目录，根据目录中的页码快速找到所需的内容。一般来说索引本…

人工智能 2023年6月6日
0047
Pytorch中的广播机制（Broadcast）

1. Pytorch中的广播机制如果一个Pytorch运算支持广播的话，那么就意味着传给这个运算的参数会被自动扩张成相同的size，在不复制数据的情况下就能进行运算，整个过程可以…

人工智能 2023年6月24日
0075
Nginx前端部署服务器

目录 1、购买一台服务器 2、远程登录服务器 3、购买域名（也可以不用） 4、域名解析 5、下载nginx 下载yum: （1）新建一个目录保存yum安装包（2）获取压缩包（3…

人工智能 2023年6月29日
0077
万物皆用MNIST—MNIST数据集及创建自己的手写数字数据集

刚刚接触到人工智能的我们，必定会遇到一个非常非常非常熟悉的朋友——MNIST这是一套流行的手写数字图片，常常被用来测试我们的思想和算法。这个数据集称为手写数…

人工智能 2023年6月15日
00158
【Pytorch深度学习实战】（4）前馈神经网络（FNN）

🔎大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流🔎📝个人主页－Sonhhxg_柒的博客_CSDN博客📃🎁欢迎各位→点赞👍 + 收藏⭐️ +…

人工智能 2023年7月13日
0041
浏览器玩转机器学习之：Teachable Machine (图像/语音/姿态识别)

Teachable Machine：浏览器玩转机器学习图像/语音/姿态识别简介：先上图：快速上手： * 新建项目准备数据 Model训练 Model运行 Model导出 …

人工智能 2023年5月25日
0086
各种卷积方式的最全讲解

文章目录一：卷积的定义二：标准卷积 * 1.1D卷积 – Ⅰ：一维Full卷积 Ⅱ：一维Same卷积 Ⅲ：一维Valid卷积 Ⅳ：三种一维卷积的相互关系 2.2D卷…

人工智能 2023年6月24日
0056
深度学习框架是否支持模型的融合和集成，如模型的蒸馏和投票方法等

问题背景在深度学习领域中，有时候需要将多个模型进行融合和集成，以提高模型的预测性能。模型的融合可以通过多种方法实现，其中包括模型的蒸馏和投票方法。本文将详细介绍深度学习框架中如何…

人工智能 2024年1月1日
0021
3D视觉——1.人体姿态估计(Pose Estimation)入门——使用MediaPipe含单帧(Signel Frame)与实时视频(Real-Time Video)

使用MediaPipe工具包进行开发什么是MediaPipe? MediaPipe是一款由Google Research 开发并开源的多媒体机器学习模型应用框架，用于处理视频、音…

人工智能 2023年6月24日
0065

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Espnet ASR Demo & Quantization Document

Requirements

Install Kaldi

Install Espnet

大家都在看