背景:
win8.1, python 3.9.7 自带idle, 模块SpeechRecognition-3.8.(pip install SpeechRecognition安装默认版本)
现象:
下载cmusphinx-zh-cn-5.2.tar.gz后,发现包中的文件/文件夹名字和模块自带的en-US文件夹下的文件/文件夹不同名。
CMU Sphinx – Browse /Acoustic and Language Models/Mandarin at SourceForge.net Speech Recognition Toolkit https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/Mandarin/;2. 在尝试运行练习小程序后,发现有错误提示,说找不到文件或文件夹。
解决办法:
-
在en-US同目录下建立一个 zh-CN文件夹
-
把cmusphinx-zh-cn-5.2.tar.gz解压后的文件/文件按照en-US中的文件/文件夹命名。其中readme 可以不更改为License.
-
运行后,中文正常输出。(有的中文还是辨认不出来。和是否能运行无关了)
-
小程序和图片附在这里,方便参考。
5.语音文件,可以自己录制一个 demo_audio.wav,也可以找一个简单一点的
附件:
- 中文语言包解压后的内容
- 模块自带英文语言包内容
- 语音识别小程序
speech_recognition的安装: pip install SpeechRecognition
import speech_recognition as sr
audio_file = "demo_audio.wav"
r = sr.Recognizer()
#打开语音文件,放在本目录下
with sr.AudioFile(audio_file) as source:
audio = r.record(source)
#将语音文件内容转换为文本
print("文本内容:",r.recognize_sphinx(audio,language="zh-CN"))
Original: https://blog.csdn.net/seeker3/article/details/123309054
Author: work-harder
Title: 语音识别SpeechRecognition中文包对应文件名的处理
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/497918/
转载文章受原作者版权保护。转载请注明原作者出处!