SpeechBrain是使用pytorch实现的灵活,用户友好的语音工具箱,以便用户可以快速实现语音识别,语音增强,信号处理等等任务,目前比较新且无相关文档,现分享相关数据处理pipeline
data prepare(基于voxcleb_prepare.py)
- 修改头文件路径 采样率 等信息
- 修改csv生成文件方法(voxcleb_prepare中 _get_utt_split_lists)
我的数据路径
train—speaker_id—wav文件
test—speaker_id—wav文件
dev—speaker_id—wav文件
logger = logging.getLogger(__name__)
OPT_FILE = "cn_dataset_prepare.pkl"
TRAIN_CSV = "train.csv"
Original: https://blog.csdn.net/qq_40790959/article/details/116916003
Author: .DDDD
Title: 语音识别框架speechbrain—speaker-recognition说话人识别/声纹识别:训练自己的数据(1)
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/512966/
转载文章受原作者版权保护。转载请注明原作者出处!