语音识别框架speechbrain—speaker-recognition说话人识别/声纹识别:训练自己的数据(1)

SpeechBrain是使用pytorch实现的灵活,用户友好的语音工具箱,以便用户可以快速实现语音识别,语音增强,信号处理等等任务,目前比较新且无相关文档,现分享相关数据处理pipeline

data prepare(基于voxcleb_prepare.py)

  1. 修改头文件路径 采样率 等信息
  2. 修改csv生成文件方法(voxcleb_prepare中 _get_utt_split_lists)
    我的数据路径
    train—speaker_id—wav文件
    test—speaker_id—wav文件
    dev—speaker_id—wav文件
logger = logging.getLogger(__name__)
OPT_FILE = "cn_dataset_prepare.pkl"
TRAIN_CSV = "train.csv"

Original: https://blog.csdn.net/qq_40790959/article/details/116916003
Author: .DDDD
Title: 语音识别框架speechbrain—speaker-recognition说话人识别/声纹识别:训练自己的数据(1)

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/512966/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球