Praat脚本-030 | 谈谈自动标注这点儿事(4)

在大家面前,我介绍或推荐了几种与自动标注相关的内容。

[En]

In front of you, I introduced or recommended several kinds of content related to automatic tagging.

第一篇文章推荐了一个入门级的“自动标注”,实际上相当于帮你添加了一些你需要的信息。

[En]

The first article recommends an entry-level “automatic tagging”, which is actually equivalent to helping you add some of the information you need.

Praat脚本-023 | 谈谈自动标注这点儿事(1)

首先,愚蠢的自动标记。

[En]

First, silly automatic tagging.

其次,使用脚本的自动注释

[En]

Second, use the automatic annotation of the script

第三,使用诸如SPPAS的自动标注,
第四,更加专业的自动贴标。

[En]

Fourth, more professional automatic labeling.

其次,这实际上是一个现成的小项目。

[En]

Second, this is actually a small off-the-shelf project.

Praat脚本-026 | 谈谈自动标注这点儿事(2)

第三个,是为大家介绍了SPPAS的使用,
语音标注自动音段对齐工具SPPAS使用笔记

这里补充一下熊老师也有一个自己写的自动标注工具,叫做xSegmenter:音段自动切分与标注工具, http://paslab.phonetics.org.cn/index.php/others/ying_yong_cheng_xu_he_gong_ju/, 有兴趣的可至此网址下载并查看使用说明。

今天的文章将对自动标注进行总结,并介绍一个更专业的标注框架。

[En]

Today’s article will make a summary of automatic tagging and introduce a more professional tagging framework.

NameAlgorithmSupported Language(s)InterfaceCode Language(s)NotesaeneasDTW30+CLI, LIB, WebPython, CNot based on ASRCMU SphinxHMM (own), RNN11CLI, LIBC, Java, PythonDARLAHMM (HTK)EnglishWeb?Based on Prosodylab-Aligner or YouTube ASRFAVE-alignHMM (HTK)EnglishCLI, (Web)Pythonacustic models from P2FA; GitHub code updated more frequently than WebGentleHMM (Kaldi)EnglishCLI, WebPythonBased on KaldiJuliusHMM (own)English, JapaneseCLI, LIBCKaldiHMM (own), DNN, RNNEnglishCLI, LIBC++CUDA supportkaldi-dnn-ali-gopHMM(Kaldi), DNN(Kaldi nnet3)EnglishCLI, LIBShell Script, C++, PythonWork with other languages given kaldi acoustic modelsLaBB-CATHMM (HTK)EnglishWebJavaMAUSHMM (HTK)21CLI, WebCMontreal Forced AlignerHMM (Kaldi)EnglishCLIPythonCan train other languagesPenn Forced Aligner (P2FA)HMM (HTK)EnglishCLI, WebPythonProsodylab-AlignerHMM (HTK)EnglishCLIPythonCan train other languagesSailAlignHMM (HTK)English, Greek, SpanishCLIPerlSPPASHMM (Julius)12+CLI, GUIPythonCan train other language, several plugins

AGPL: GNU Affero General Public License
Apache: Apache License
CLI: command line interface
DNN: Deep Neural Network
DTW: Dynamic Time Warping
GPL: GNU General Public License
GUI: graphical interface
HMM: Hidden Markov Model
LIB: library callable by third party software
MFCC: Mel-frequency Cepstral Coefficients
MIT: MIT License
RNN: Recurrent Neural Network
Web: Web-based graphical interface, local and/or remote

以上节选自,https://github.com/pettarin/forced-alignment-tools,有兴趣的可至这个项目页面查看详细信息,包括每个工具的链接。

以上基本上是业界一段时间内,以及当前比较流行的一些自动标注的工具或者框架,另外一种叫法也叫音素强制对齐,目的是为了让语音的音素与音频对应起来。可见大部分的仍然是基于HMM算法的,包括刚才补充的熊老师的工具也是基于HMM算法。

推荐有自动标注强需求的同学重点关注,Montreal Forced Aligner,该框架目前使用比较广泛,而且效果也比较好,虽然很多大厂已经在使用深度学习网络的算法,但是作为普通用户,小而精悍的HMM算法仍然是首选。 montreal框架有专门的官网网站,也可以在网上搜索相关的安装配置方法。

如果数据不多,需要进行自动阅卷,可以在公众号后台发送《自动阅卷》咨询。

[En]

If there is not much data and needs to be marked automatically, you can send “automatic marking” consultation in the background of the official account.

关注

关于对本站脚本的使用咨询,以及功能修改,增加等,都可以扫QQ咨询群,私信群主。

Praat脚本-030 | 谈谈自动标注这点儿事(4)

; 版权说明

1、版权归本公众号”极地语音工作室”,原名”语音处理小站”所有;

2、未经本站或者作者允许, 不得任意转载本文内容,否则将视为侵权;

3、转载或者引用本文内容请注明来源及原作者;

4、对于不遵守此声明或者其他违法使用本站内容者,本人依法保留追究权等。

Original: https://blog.csdn.net/shaopengfei/article/details/121584486
Author: 极地语音工作室
Title: Praat脚本-030 | 谈谈自动标注这点儿事(4)

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/512693/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球