PaddleSpeech 音频和视频惊艳众人的准确率

2023年5月27日下午6:12 • 人工智能 • 阅读 78

1、关于视频抽取固定采样率音频：ffmpeg -i test2.mp4 -f wav -ar 16000 test3.wav

-i .[迅雷下载xunbo.cc]爱情公寓第二季EP20.rmvb // 输入的文件路径

-f wav ///输出wav格式的文件

-ar 16000 //采样率为16K

2-20.wav // 输出的文件名

2、关于音频转文字部分，模型使用paddle预训练的模型，并进行部署：

4、关于准确率说明：调研了一圈中文中关于音频转文字的开源预训练模型，paddle的是最高的，达到了95%+，可直接使用。

5、模型应用中的入参部分文件名不要有中文

Original: https://blog.csdn.net/sslfk/article/details/123278251
Author: 会发paper的学渣
Title: PaddleSpeech 音频和视频惊艳众人的准确率

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/527193/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【PyTorch】深度学习实践之RNN高级篇—实现分类

本文目录 1. RNN分类器 2. 分类器实现 * 准备数据准备模型双向RNN/LSTM/GRU * forword过程名字转换tensor 训练过程测试过程 3. 完整代…

人工智能 2023年7月22日
0061
Python数据分析案例05——影响经济增长的因素(随机森林回归)

在计量经济学里面的研究，围绕着影响GDP的因素的研究有很多，基本都是做回归，拿GDP作为被解释变量y，其他因素作为解释变量x。然后做线性回归，时间序列就做自回归，面板数据就做固定效…

人工智能 2023年6月17日
0056
头部姿态获取算法概述(坐标系转换)

头部姿态获取算法概述 —— 才疏学浅, 难免有错误和遗漏, 欢迎补充和勘误. 获取头部运动姿态的流程图如下：图1. 获取头部运动姿态的流程图首先通过Dlib库得到2D人脸68个…

人工智能 2023年6月20日
00199
200 aaaaaaaa ggggggjjjtrr

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月29日
0073
贝叶斯回归预测

[ _贝叶斯_优化是一种优化算法，用于寻找最优的超参数组合。在xgboosting _回归预测_中，我们可以使用 _贝叶斯_优化来优化模型的超参数，例如树的最大深度、学习率、正则化…

人工智能 2023年6月18日
0076
【Opencv】图像分割——区域分裂合并

文章目录 1 环境 2 效果 3 原理 4 代码 1 环境 Python 3.8.8 PyCharm 2021 opencv-python 2 效果 ; 3 原理区域生长是从某个…

人工智能 2023年7月18日
0048
局部规划算法：DWA算法原理

文章目录 * – 一、算法概述 – 二、算法原理 – + 1、运动学模型 + 2、速度采样 + 3、目标函数 – 三、应用场景 &#…

人工智能 2023年6月23日
0084
基于知识图谱的金融舆情风险分析及自动表示学习技术

公众号系统之神与我同在知识图谱 in 4Paradigm标准化知识图谱构建风险传导分析案例认知智能是人工智能发展的高阶形态知识图谱：AI的大脑 ·一种大规模语义网络·一种结构化…

人工智能 2023年6月1日
0090
一文速学-Pandas索引设置操作各类方法详解+代码展示

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月19日
0066
使用Protege构建知识图谱

使用Protege构建知识图谱一、创建类二、创建类间关系三、创建类的属性四、创建实例 * 1.创建国家实例 2.创建武器实例 3.创建实例间的关系 4.创建实例的属性五、…

人工智能 2023年6月1日
0095
不知道用什么图表展示数据？看这份图表选择指南就够了

先看这张思维导图，能够帮助大家更快了解各类型图表的数据特点。基于功能和属性：可将图表分为四大类，具体见下图：基于使用场景，则可以分为两大类——日常需求、专业需求。 01 日常需…

人工智能 2023年7月15日
0071
dlib.get_frontal_face_detector()及detector()返回值

目录 1.结论 2.验证过程 2.1代码 2.2数据：传入图片（必应搜索获取） 2.3输出结果 3.参考致谢 1.结论 detector=dlib.get_frontal_face…

人工智能 2023年5月28日
00102
深度学习中的优化算法之SGD

之前在https://blog.csdn.net/fengbingchun/article/details/75351323 介绍过梯度下降，常见的梯度下降有三种形式： BGD 、…

人工智能 2023年6月16日
0078
MR案例：计算学生成绩

计算学生成绩一、提出任务二、完成任务 * （一）准备数据 – 1、在虚拟机上创建文本文件 2、上传文件到HDFS指定目录（二）实现步骤 – 1、创建M…

人工智能 2023年7月30日
0068
图神经网络基础与前沿,神经系统知识网络图

知识图谱怎样入门知识图谱作为一门学问，绝不是用个图数据库写几条查询，或者用规则写一个表格的提取，就可以称为成功的运用的。和所有的学科一样，都需要长期的艰苦的努力，在充分了解前人成…

人工智能 2023年6月1日
0086
ImageNet1K的下载与使用

0、前言 2、val集 * 2.1 下载 2.2 处理 0、前言 ImageNet不用多说，它包含了非常多的图片，总共有2w多个分类，但是显然太多。所以一般更常用的是ImageNe…

人工智能 2023年7月25日
0079

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

PaddleSpeech 音频和视频惊艳众人的准确率

大家都在看