语音识别框架speechbrain—speaker-recognition说话人识别/声纹识别:训练自己的数据(1)

2023年5月25日上午7:48 • 人工智能 • 阅读 99

SpeechBrain是使用pytorch实现的灵活，用户友好的语音工具箱，以便用户可以快速实现语音识别，语音增强，信号处理等等任务，目前比较新且无相关文档，现分享相关数据处理pipeline

data prepare（基于voxcleb_prepare.py）

修改头文件路径采样率等信息
修改csv生成文件方法(voxcleb_prepare中 _get_utt_split_lists)
我的数据路径
train—speaker_id—wav文件
test—speaker_id—wav文件
dev—speaker_id—wav文件

logger = logging.getLogger(__name__)
OPT_FILE = "cn_dataset_prepare.pkl"
TRAIN_CSV = "train.csv"

Original: https://blog.csdn.net/qq_40790959/article/details/116916003
Author: .DDDD
Title: 语音识别框架speechbrain—speaker-recognition说话人识别/声纹识别:训练自己的数据(1)

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/512966/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Learning Memory-guided Normality for Anomaly Detection 论文解析——模型介绍

Learning Memory-guided Normality for Anomaly Detection 论文模型介绍本文为对 _Learning Memory-guided…

人工智能 2023年7月10日
0079
合成孔径雷达成像算法与实现(信号处理基础知识点)

最近由于学业上需要，重新学习了《合成孔径雷达成像算法与实现》一书，其中第二章是信号处理基础，在此记录下学习过程。一、信号处理基本概念 1.卷积与相关卷积：相关: 卷积从几何解…

人工智能 2023年6月20日
0067
视觉SLAM十四讲学习笔记-第五讲-图像和实践

专栏系列文章如下：视觉SLAM十四讲学习笔记-第一讲_goldqiu的博客-CSDN博客视觉SLAM十四讲学习笔记-第二讲-初识SLAM_goldqiu的博客-CSDN博客视…

人工智能 2023年6月21日
0084
一种可以根据相关性进行特征筛选的函数

去掉相关性太高的特征 def identify_collinear(corr_matrix,correlation_threshold,X): 相关性矩阵 upper = corr…

人工智能 2023年7月18日
0074
滑模变结构控制（2）–RBF神经网络

目录前言 1 问题描述 2 RBF神经网络原理 3 控制算法设计与分析 4 仿真实例 5 总结参考文献前言如果被控对象的数学模型已知，滑模控制器可以使系统输出直接跟踪期望指…

人工智能 2023年7月28日
0055
【已知一点经纬度和距离，计算另一点的经纬度】

根据一点经纬度和距离，计算另一点的经纬度计算代码推理过程计算推导计算摄像头到目标检测点得距离d，详见：https://blog.csdn.net/qq_41694461/a…

人工智能 2023年7月9日
0093
AI引领，语音识别技术有怎样的发展趋势？

语音识别是人工智能领域的一个重要方向，现在已逐渐发展为一个具有广阔前景的高新技术产业，许多企业在语音识别技术上潜精研思。例如，百度借助自己的人工智能生态平台，推出了智能行车助手Co…

人工智能 2023年5月25日
0076
GTX1060+win10+CUDA11.3+cudnn8.2+pytorch1.11.0——个人配置踩坑日记

以下是我亲测有效的使用 GTX 1060 的各部分安装版本电脑系统：window 10python版本：3.8.13pytorch版本：1.11.0CUDA版本：11.3cuDNN…

人工智能 2023年5月26日
0060
特征匹配算法GMS(Grid-based Motion Statistics)理论与实践

GMS一种基于运动统计的快速鲁棒特征匹配过滤算法，能明显地改善匹配结果，目前已经集成进入OpenCV之中文章及代码地址项目地址：GMS: Fast and Robust Fea…

人工智能 2023年6月24日
0064
【读书笔记】Verilog的亚稳态现象和跨时钟域处理方法

书※目：FPGA深度解析_第七章_樊继明著高级FPGA设计结构、实现和优化_第六章_孟宪元译文章目录一、亚稳态（1）跨时钟域的亚稳态现象（2）亚稳态的多径传输二、跨时钟域…

人工智能 2023年5月30日
0087
卷积层的反向传播如何计算

问题描述卷积神经网络（Convolutional Neural Networks, CNN）是深度学习中非常重要的一种网络结构。在CNN中，卷积层（Convolutional L…

人工智能 2024年1月1日
0038
工具变量法案例【计量经济系列（八）】

stata 工具变量法案例【计量经济系列（八）】文章目录 1.数据集 2. 初步回归，发现内生变量 3. 使用工具变量，2SLS回归 4. 检验外生性，过度识别检验 5. 检验 …

人工智能 2023年6月17日
00138
Python深度学习基于PyTorch：第3章 Pytorch神经网络工具箱

Python深度学习基于PyTorch 第3章 Pytorch神经网络工具箱 * 3.1 神经网络核心组件 3.2实现神经网络实例 – 3.2.1背景说明 3.2.2准…

人工智能 2023年7月14日
0071
计算机视觉入门知识一：数据分类基础（李飞飞斯坦福计算机视觉课程）

目录数据驱动方法第一个分类器：最近邻分类器（Nearest Neighbor）计算机如何比较两张图片的差别（L1距离比较法） KNN（K值最近邻算法）关于L1和L2范数…

人工智能 2023年7月1日
0080
Python 正则表达式详解（建议收藏！）

目录 match 匹配字符串单字符匹配 . 匹配任意一个字符 \d 匹配数字 \D 匹配非数字 \s 匹配特殊字符，如空白，空格，tab等 \S 匹配非空白 \w 匹配单词、字符…

人工智能 2023年7月3日
0068
Conv2d参数详解

torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, g…

人工智能 2023年7月13日
00113

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

语音识别框架speechbrain—speaker-recognition说话人识别/声纹识别:训练自己的数据(1)

大家都在看