云-短语音识别

2023年5月25日下午4:06 • 人工智能 • 阅读 81

短语音识别的标准版相当常见，比如微信上的语音转文字。对方发送的语音可以直接转换成文字。一般来说，60秒内的语音被准确识别为文本，适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景。

[En]

The standard version of short speech recognition is quite common, such as voice-to-text conversion on Wechat. The voice sent by the other party can be converted directly into text. Generally speaking, speech within 60 seconds is accurately recognized as text, which is suitable for short voice interaction scenarios such as mobile phone voice input, intelligent voice interaction, voice instructions, voice search and so on.

各大云工厂都在做这项功能，一般功能如下：

[En]

This function is being done by all major cloud factories, and the general features are as follows:

技术领先识别准确

采用国际领先的流媒体端到端语音语言集成建模方法，结合百度自然语言处理技术，近场普通话识别准确率高达98%。

[En]

Using the leading international streaming end-to-end speech language integration modeling method, integrated with Baidu natural language processing technology, the near-field Mandarin recognition accuracy is up to 98%.

多语种和多方言识别

支持普通话和略带口音的中文识别；支持广东话和四川话识别；支持英语识别。

[En]

Support Mandarin and slightly accented Chinese recognition; support Cantonese and Sichuan dialect recognition; support English recognition.

深度语义解析

支持50多个领域的语义理解，如：天气，交通，娱乐等。还可接入智能对话定制与服务平台UNIT自定义语义理解和对话服务，让您更准确地理解用户意图。

中文标点智能断句

使用大型数据集训练语言模型，以智能地匹配适当的标点符号(包括，.！？)使识别结果的表达更加通俗易懂。

[En]

Train the language model using large data sets to intelligently match appropriate punctuation (including,.!? ) to make the expression of the recognition result more understandable.

数字格式智能转换

根据对语音内容的理解，将数字序列、小数、时间、分数和基本运算符正确转换为数字格式，使识别的数字结果更符合使用习惯，直观自然。

[En]

According to the understanding of speech content, the digital sequence, decimal, time, fraction and basic operators can be correctly converted into digital format, which makes the recognized digital results more in line with the habit of use, intuitive and natural.

支持自助训练专属模型

语音自助培训平台支持自助培训模式，零码上传即可完成培训。业务领域的词汇识别率可精准提升5%-25%，可独家使用。

[En]

Self-help training model is supported on the voice self-training platform, and zero code can be uploaded to complete the training. The vocabulary recognition rate in the business domain can be accurately improved by 5-25%, and can be used exclusively.

不仅是开头的语音，还有其他应用场景：

[En]

Not only the voice at the beginning, but also other application scenarios:

语音输入

破除生词和拼音障碍，使用语音即时输入。可以有效识别带有轻微口音的普通话、广东话、四川话和英语，并可以根据句子的意思添加自动纠错和自动标点符号，使输入更快，沟通更顺畅。

[En]

Get rid of obscure words and pinyin barriers and use voice instant input. Mandarin, Cantonese, Sichuan dialect and English with slight accent can be effectively identified, and automatic error correction and automatic punctuation can be added according to the meaning of the sentence, making the input faster and the communication more smooth.

语音搜索

搜索内容直接语音输入，应用于网页搜索、汽车搜索、手机搜索等多种搜索场景，解放双手让搜索更高效，适用于视频网站、智能硬件、手机厂商等行业。

[En]

The search content is input directly by voice, which is applied to web search, car search, mobile search and other search scenarios, liberating hands to make search more efficient, suitable for video websites, smart hardware, mobile phone manufacturers and other industries.

语音指令

无需手动操作，可以通过语音直接对设备或者软件发布指令，控制操作，适用于智能硬件、车载系统、机器人、手机APP、游戏等多个领域。

社交聊天

在社交聊天中，语音输入直接转换为文本，更加方便，或者当您收到不适合播放的语音消息时，可以将其转换为文本进行查看，以满足更多聊天场景。

[En]

In social chat, the voice input is directly converted to text, which makes it more convenient, or when you receive a voice message that is not suitable for playback, it can be converted to text for viewing to meet more chat scenarios.

游戏娱乐

在游戏中聊天是必不可少的，双手都不能打字，语音输入可以把语音变成文字，让用户在操作的同时也能直观的看到聊天内容，多元化的满足用户的聊天需求。

[En]

Chat in the game is essential, both hands can not type, voice input can turn voice chat into text, so that users can also intuitively see the chat content while operating, diversified to meet the chat needs of users.

Original: https://blog.csdn.net/m0_66194642/article/details/123735742
Author: 打工人何苦为难打工人
Title: 云-短语音识别

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/514973/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

打游戏用什么蓝牙耳机好？英雄联盟手游推荐蓝牙耳机

蓝牙耳机作为手机的外围产品，是很多人的必需品。上下班的路很无聊，很无聊。我真的觉得如果不看视频，不听音乐打发时间，时间会很长。但是，如果在公共场所播放音乐，就没有素质了，所以外出时…

人工智能 2023年5月25日
00123
Matlab数字图像处理 02 灰度变化（图像直方图、直方图均衡化、直方图匹配）

第二章灰度变化 2.1 图像的亮度、对比度和动态范围 * 2.1.1 亮度 2.1.2 对比度 2.1.3 动态范围 2.2 线性灰度变换 * 2.2.1 具有饱和处理的线性灰度…

人工智能 2023年6月17日
0073
【AI框架】MMDetection3D 使用指南

MMDetection3D 是一个基于 PyTorch 的目标检测开源工具箱, 下一代面向 3D检测的平台对安装 MMDetection3D有问题的同学可以看：【星光02】MMD…

人工智能 2023年6月17日
00110
多层感知机 pytorch学习

MLP 把许多全连接层堆叠在一起，每一层都输出到上面的层 argmax返回的是最大数的索引.argmax有一个参数axis,默认是0, ==对数据类型敏感，需要转换成相同类型 cl…

人工智能 2023年7月16日
0069
（一）Spring启示录

文章目录启示代码代码存在的问题引出IoC（控制反转）引出Spring框架 Spring学习目录下一篇：（二）Spring概述启示代码一个简单的业务需求：使用Mysql…

人工智能 2023年6月28日
00104
自动驾驶笔记-轨迹跟踪之①纯跟踪算法（Pure Pursuit）

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、阿克曼转向模型 * 1.1 模型理解 1.2 模型表达二、纯跟踪算法（Pure Pursui…

人工智能 2023年6月1日
0076
简析三种近场通信及其未来发展趋势

蓝牙篇蓝牙是一种短距无线通信的技术规范，它最初的目标是取代现有的掌上电脑和移动电话等各种数字设备上的有线电缆连接。从目前的应用来看，由于蓝牙体积小和功率低等特点，其应用已不局限于…

人工智能 2023年5月25日
0091
构建民航业知识图谱并实现语义查询

CivilAviation Q&A 根据民航业年度公报（年报）构建民航业知识图谱并实现语义查询。项目地址：https://github.com/ShawnHXH/QA-Ci…

人工智能 2023年6月1日
0099
pytorch训练网络时候出现loss nan的几种情况及解决方法

训练深度学习网络的过程中出现 loss nan总是让人觉得头疼，本人这次是在pytorch的半精度amp.autocast, amp.GradScaler训练时候出现了loss n…

人工智能 2023年6月17日
0092
Pandas之四缺失数据处理

Pandas之四缺失数据处理在实际的数据处理过程当中，不可避免地会遇到有部分数据缺失。比如在分析股票行情数据时，有部分股票有时会停牌就会出现行情数据缺失的情况。一般在panda…

人工智能 2023年7月9日
0064
基于Matlab的人脸识别设计（PCA）

1 PCA主成分分析图像预处理是人脸识别的重要组成部分。由于图像采集环境不同，输入测试图像常常存在一些问题，如不同程度的噪声和图像对比度不足。再者，获取距离和焦距大小之类的外部因…

人工智能 2023年6月17日
00104
R语言计量（一）：一元线性回归与多元线性回归分析

文章目录一、数据调用与预处理二、一元线性回归分析三、多元线性回归分析 * （一）解释变量的多重共线性检测（二）多元回归 – 1. 多元最小二乘回归 2. 逐步回…

人工智能 2023年6月17日
00106
使用python操作文件和文件夹

文件操作的作用：把一些内容（数据)存储起来，可以让程序下一次执行的时候直接使用，而不必重新制作一份，省时省力。文件操作步骤： 1.打开文件 2.读写操作 3.关闭文件（释放内…

人工智能 2023年6月30日
00137
数据分析之落地sop流程

作者：JanieLiu公众号《溜溜笔记说》前言数据分析涉及很多知识点，各个网站也都能搜到，但很少有一种系统化的流程来参考，也有读者后台留言问到数据分析的流程，所以我认认真真的整…

人工智能 2023年7月18日
0051
PyTorch学习笔记（二）：PyTorch简介与基础知识

👨‍💻 作者简介：大数据专业硕士在读，CSDN人工智能领域博客专家，阿里云专家博主，专注大数据与人工智能知识分享，公众号：GoAI的学习小屋，免费分享书籍、简历、导图等资料，更有…

人工智能 2023年6月16日
0098
猿创征文 |【Linux】常用命令

🍁 博客主页：👉@不会压弯的小飞侠✨ 欢&amp…

人工智能 2023年5月30日
00109

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

云-短语音识别

大家都在看