kaldi 发音字典生成

2023年5月23日下午10:13 • 人工智能 • 阅读 71

kaldi 发音字典可以通过3种工具来生成,分别是:g2p-seq2seq Phonetisaurus 和 Sequitur,据说g2p-seq2seq的准确性更好些,今天我们就来介绍以下g2p-seq2seq的使用

python的版本最好是3.6。

tensorflow的版本1.14即可,千万不要安装2.0+版本,会报某些模块找不到.

1.下载源码
https://github.com/cmusphinx/g2p-seq2seq

2.安装
解压g2p-seq2seq并进入该目录下:
执行:
sudo python setup.py install
安装过程中,提示却少什么库,安装就可以了.

1.输入单词给出识别音素
g2p-seq2seq –interactive –model model_folder_path

hello
HH EH L OW

2.转换单词文件为音素(生成发音字典)
g2p-seq2seq –decode your_wordlist –model_dir model_folder_path
默认输出到终端上,如果想输出到文件,可以执行:
g2p-seq2seq –decode your_wordlist –model_dir model_folder_path > phoneme.txt

3.训练模型

下载字典
https://github.com/cmusphinx/cmudict

g2p-seq2seq –train train_dictionary.dic –model_dir model_folder_path

注意:model_folder_path必须是一个目录

遇到的一个问题:
大概是AttributeError: ‘…Dataset’ object has no attribute ‘output_shapes’

解决方案类似:
train_dataset = train_dataset.padded_batch(BATCH_SIZE, train_dataset.output_shapes)

with

train_dataset = train_dataset.padded_batch(BATCH_SIZE, tf.compat.v1.data.get_output_shapes(train_dataset))

参考:
https://www.jianshu.com/p/0682b9f328c5

Original: https://blog.csdn.net/wyw0000/article/details/121852581
Author: wyw0000
Title: kaldi 发音字典生成

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/498423/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

论文翻译：2020_DCCRN: Deep Complex Convolution Recurrent Network for Phase-Aware Speech Enhancement

论文地址：DCCRN：用于相位感知语音增强的深度复杂卷积循环网络论文代码：https://paperswithcode.com/paper/dccrn-deep-complex-c…

人工智能 2023年6月6日
00103
逻辑回归（对数几率回归）Logistic Regression

文章目录前言一、引入知识 * 1.样本特征（feature） 2.决策边界（Decision Boundary） 3.假设函数（hypothesis function） 4.损…

人工智能 2023年6月18日
0052
Android 音频开发之音频焦点处理

Android是多任务系统，Audio系统是竞争资源。在Android系统中允许多个应用同时播放音频，例如，我们在播放音乐的时候，点开了一个视频，如果音乐和视频声音混合在一起，这样…

人工智能 2023年5月27日
00134
CDH大数据平台 23Cloudera Manager Console之azkaban与freeIPA、Kerberos等组合配置(markdown新版四)

### 回答1：尚硅谷大数据_技术之 _cdh vmware是一个虚拟机镜像，用于学习和实践大数据_技术。 _CDH_是 _Cloudera_公司的一整套Hadoop生态系统…

人工智能 2023年7月30日
0062
pandas5 数据分组与聚合

5.数据分组与聚合 1.groupby方法： DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=…

人工智能 2023年7月9日
0072
【吴恩达deeplearning.ai】Course 5 – 2.5 学习词嵌入

学习词嵌入 (Learning Word Embeddings) 在本节视频中，你将要学习一些具体的算法来学习词嵌入。在深度学习应用于学习词嵌入的历史上，人们一开始使用的算法比较复…

人工智能 2023年5月28日
0082
超详细的Python matplotlib 绘制柱状图

复习回顾 Python 为数据展示提供了大量优秀的功能包，其中 matplotlib 模块可以方便绘制制作折线图、柱状图、散点图等高质量的数据包。关于 matplotlib 模块…

人工智能 2023年7月14日
0066
Scanpy(六)空间转录组数据的分析与可视化

目录 Reading data QC and preprocessing Manifold embedding and clustering based on transcript…

人工智能 2023年6月19日
0089
100天精通Python（数据分析篇）——第65天：Pandas聚合操作与案例

### 回答1：这个问题的意思是询问一个学习 Python 数据分析_的 _100 天_计划，我的回答如下： _Python 数据分析_是非常重要的技能之一，学习它需要长时间的实…

人工智能 2023年7月29日
0047
CUDA11.7版本与pytorch1.12下载（conda安装pytorch出现）相关出错解决 HTTP 000 CONNECTION FAILED for url

. HTTP 000 CONNECTION FAILED for url An HTTP error ocurred when trying to retrieve this UR…

人工智能 2023年7月20日
0047
全连接层tf.keras.layers.Dense()介绍

函数原型 tf.keras.layers.Dense( units, activation=None, use_bias=True, kernel_initializer=’glo…

人工智能 2023年5月23日
0087
【读论文】多/高光谱图像和 LiDAR 数据联合分类方法研究（2020）

【读论文】多/高光谱图像和 LiDAR 数据联合分类方法研究（2020）王青旺DOI 文章目录摘要：关键词：结论： 1.该论文研究了什么？ 2.创新点在哪？ 3.研究方法是什…

人工智能 2023年7月2日
0049
本地搭建自己的电影网站，并发布公网访问 2-3

系列文章在上篇介绍中，我们为大家展示了如何在本地电脑上搭建一个适合Maccms10运行的环境。接下来，我们就可以在本地电脑上，安装MacCMS10网页，并处理出现的验证码错误和后…

人工智能 2023年6月30日
0082
python 基础

df-list=df 列要相等 series-list=series 长度要相等 array-list=array 长度要相等 df-df=df 长度可以不相等 series-se…

人工智能 2023年7月7日
0042
语音识别之MFCC特征提取

提示：写完文章后，目录可以自动生成，如何生成右侧的帮助文档。 [En] Tip: after the article is written, the directory can b…

人工智能 2023年5月27日
0086
目标检测数据集标注工具LabelImg从安装到使用详解

1.LabelImg的安装在Windows10系统下使用Anaconda来安装LabelImg，步骤如下：首先打开conda 这里建议专门创建一个新环境来安装LabelImg，…

人工智能 2023年6月16日
0057

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

kaldi 发音字典生成

大家都在看