Praat脚本-030 | 谈谈自动标注这点儿事(3)

目录

简介

SPPAS工具是由 Brigitte Bigi(Laboratoire Parole et Langage - Aix-en-Provence - France)开发的。在网上提供免费下载及使用。这是一款目前比较流行的自动标注,音段对齐的工具,目前应用于法语、英语、汉语等都有不错的效果。虽然音段自动对齐的准确率并不完善,但是对于一般的语音研究者来说,能够自动产生出带有音段信息,并且边界相对整齐的 Praat标注文件 TextGrid已经是大大提升了工作效率。所以推荐给进行语音研究,而且数据量规模很大的朋友。

有关于这个工具的详细说明,介绍,文档,由此相关的论文等信息请参阅官方网站: http://www.sppas.org/。在这里只是把使用的时候注意的一些地方写出来,以方便一些可能对插件包安装使用并不熟悉的同学。另外也请注意,本文主要使用是有关于 SPPAS 2.4版本(个人更喜欢使用2.4,界面也简单,新版本。。。大家随意),而最新的版本好像是 3.9(2021年7月6日更新),有关于最新的版本使用方面的问题,其实可以直接给作者发邮件询问,甚至作者也放了完整的安装视频,虽然是法语的,但是我觉得步骤还是比较清楚的。

安装环境

必须的软件环境:

  • Python
  • wxPython
  • Julius

安装Python

Python的官方网站是: https://www.python.org/,下载页在: https://www.python.org/downloads/release/python-2713/,请选择32位下载, Windows x86 MSI installer。不需要专门针对64位的机器下载64位,尤其对于初学者,32位可以将Python的bin目录增加到系统环境变量里,而64位有时候需要手工增加,如果你熟悉这个操作,可以选择64位Python安装,这里以32位为准。

如果使用SPPAS 2.4版本,请下载安装Python2.7版本使用。如果使用SPPAS 3.0以后版本,请下载安装Python3版本以上。

安装过程类似于常规的软件安装过程,第一步是使用默认方法,即为系统的所有用户安装。

[En]

The installation process is similar to the regular process of installing software, and the first step is to use the default method, that is, to install it for all users of the system.

Praat脚本-030 | 谈谈自动标注这点儿事(3)

第二步,安装的路径,不建议目录太深,最好在常用盘,比如C盘或者D盘的根目录下,如图所示,在C盘根目录下的 Python27就可以,27表示是2.7版本,有其它开发需求的朋友可能也会安装Python3.4以上版本,所以这里也要注意区分。

Praat脚本-030 | 谈谈自动标注这点儿事(3)

在这一步,给出了64位和32位安装的区别,上图是64位,下图是32位,下图有一个选项,可以将 Python.exe设置到系统的环境变量里, 这个很关键,直接关系运行SPPAS的时候是否能直接从系统调用Python

Praat脚本-030 | 谈谈自动标注这点儿事(3)
Praat脚本-030 | 谈谈自动标注这点儿事(3)
最后安装Python成功。
Praat脚本-030 | 谈谈自动标注这点儿事(3)
检验一下,点击win+R键,调出运行窗口,输入cmd,回车,也可以直接搜索命令行窗口, 输入python,如果有正确的显示python的信息,说明安装成功。

安装WxPython

WxPython是辅助Python实现可视化界面的。可以根据前面安装Python选择32位或者64位:

32位:https://sourceforge.net/projects/wxpython/files/wxPython/3.0.2.0/wxPython3.0-win32-3.0.2.0-py27.exe/download
64位:https://sourceforge.net/projects/wxpython/files/wxPython/3.0.2.0/wxPython3.0-win64-3.0.2.0-py27.exe/download

安装过程如下,第一步是直接点击下一步。

[En]

The installation process is as follows, the first step is to click the next step directly.

Praat脚本-030 | 谈谈自动标注这点儿事(3)

这一步也是选择接受协议Accept the agreement直接点下一步。

Praat脚本-030 | 谈谈自动标注这点儿事(3)

第三步很关键,这个路径 一定要和前面Python27目录保持一致,在本例中Python安装在C盘,则象下面这样,这样的路径才是正确的。site-packages表示WxPython作为一个 模块包,在Python里。同样如果你选择的是Python3+SPPAS3的环境,这里也要安装在Python3版本的这个目录里。

Praat脚本-030 | 谈谈自动标注这点儿事(3)

最后,这三个选项默认都选中,点击finish.

Praat脚本-030 | 谈谈自动标注这点儿事(3)

安装Julius

Julius是专门用来做对齐的工具,不需要安装,只是告诉系统它的位置就可以了。这个工具也可以用HVite代替,官网上也有介绍。

http://sourceforge.jp/projects/julius/downloads/60273/julius-4.3.1-win32bin.zip/

直接解压到一个目录里, 打开这个目录,打开bin目录,找到Julius.exe,注意因为本文下载的是Julius 4.3.1版本,所以其实这个文件名称是Julius-4.3.1.exe,即要把这个文件拷贝到C:\windows\目录下,并且改名为:julius.exe 。

注意:64位机器不需要找专门的这个版本,就使用和第(3)同样的方式操作就可以了,已经测试过,是成功了。

Praat脚本-030 | 谈谈自动标注这点儿事(3)

SPPAS使用

SPPAS工具下载后直接解压到磁盘根目录下,比如D盘下。D:\sppas\,目录级别尽量不要太深。
打开后,直接打开里面的sppas.bat,就可以运行了。

Praat脚本-030 | 谈谈自动标注这点儿事(3)

打开之后是这样的界面,注意Setting里面需要设置结果文件为TextGrid,现在软件默认的是xra文件。

Praat脚本-030 | 谈谈自动标注这点儿事(3)

; 数据格式

首先,在使用软件时有一些需要注意的事项。想要使用该软件的学生必须仔细查看它是否符合要求。

[En]

First of all, there are some matters needing attention when using the software. students who want to use the software must carefully see if it meets the requirements.

  • 与声音对应的文本文件,必须是UTF8格式;
  • 声音文件必须是单通道文件,16位精度,格式为WAVE或者AU,最好是采样率为16K;
  • 所有文件名不含特殊字符,如中文,不允许有空格,建议使用字母、下划线、数字或下划线
    [En]

    there are no special characters in all file names, such as Chinese, spaces are not allowed, only letters, underscores, numbers or underscores are recommended*

  • 声音文件和对应的文本文件的名称必须完全相同
    [En]

    the names of the sound file and the corresponding text file must be exactly the same*

  • 语音最好是录音条件好的数据,即录音环境非常安静。发音清晰,将显著提高自动标注效果。如果是在嘈杂的录音、野外录音环境中,这样的自动贴标效果是很差的。
    [En]

    Voice is preferably data with good recording conditions, that is, the recording environment is very quiet. The pronunciation is clear, which will significantly improve the effect of automatic tagging. If it is in a noisy environment of recording, field recording, such automatic labeling effect is very poor.*

  • 最好在记录文件的每个单元之间有一个明确的停顿。例如,如果你正在记录很多单词和单词,那么读单词和单词时发音最好有一些停顿;如果你正在记录很多句子,那么句子之间应该有明显的停顿,这也可以提高自动批改的准确性。
    [En]

    it is better to have a clear pause between each unit of the recording file. For example, if you are recording a lot of words and words, then the pronunciation had better have some pauses when reading words and words; if you are recording a lot of sentences, then there should be obvious pauses between sentences, which can also improve the accuracy of automatic marking.*

数据准备

准备音频和文本

Praat脚本-030 | 谈谈自动标注这点儿事(3)

注意声音文件和文本文件是对应出现的。文件名称必须一样。而文本文件,比如Sound_1.txt里面就是这个声音的内容,没有其它多余信息。如红色箭头所指。在保存这个文本文件的时候,需要注意编码格式为UTF-8格式,如下面的红色方框所示。

Praat脚本-030 | 谈谈自动标注这点儿事(3)

; 导入SPPAS进行切分

经过上述步骤,我们制作了一批声音文件和文本文件,并将这些文件放在同一个目录下:

[En]

After the above steps, we have made a batch of sound files and text files and put these files in the same directory:

Praat脚本-030 | 谈谈自动标注这点儿事(3)

然后打开SPPAS这个工具,点击Add files将声音文件添加到窗口里,同时,有同样文件名的txt也会被添加到窗口里,把这些文件通过使用ctrl或者shift键,全部选择,然后把右侧的几个对齐的选项选择,并且在语言里选择相应的语言,比如这里选择的是中文,cmn。SPPAS最新的3.9版本这个地方是变化挺大的,请注意。

Praat脚本-030 | 谈谈自动标注这点儿事(3)

点击右下角的这个长的按钮,就是执行按钮,然后系统就会自动产生出来对齐音段的TextGrid文件。一般情况下,会同时产生几个TextGrid。你可以分别打开看一下,分别是运行的中间步骤。

Praat脚本-030 | 谈谈自动标注这点儿事(3)

我们只需要最终的结果 Sound_-palign.TextGrid文件。
这就是最终的结果:如你所见,准确率不高,但它省去了大量手动添加边界和输入字符的过程。

[En]

This is the end result: as you can see, the accuracy is not high, but it saves a lot of manual process of adding boundaries and entering characters.

Praat脚本-030 | 谈谈自动标注这点儿事(3)

关注

关于对本站脚本的使用咨询,以及功能修改,增加等,都可以扫QQ咨询群,私信群主。

Praat脚本-030 | 谈谈自动标注这点儿事(3)

; 版权说明

1、版权归本博客作者所有;

2、未经本站或者作者允许, 不得任意转载本文内容,否则将视为侵权;

3、转载或者引用本文内容请注明来源及原作者;

4、对于不遵守此声明或者其他违法使用本站内容者,本人依法保留追究权等。

Original: https://blog.csdn.net/shaopengfei/article/details/120111369
Author: 极地语音工作室
Title: Praat脚本-030 | 谈谈自动标注这点儿事(3)

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/525239/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球