网络编程
位置:首页>> 网络编程>> Python编程>> python语音识别的转换方法

python语音识别的转换方法

作者:辉煌zzg  发布时间:2023-12-06 20:56:57 

标签:python,语音,识别

使用pyttsx的python包,你可以将文本转换为语音。

安装命令

pip install pyttsx3 -i https://pypi.tuna.tsinghua.edu.cn/simple

运行一个简单的语音 ‘大家好'。


import pyttsx3 as pyttsx
engine = pyttsx.init() #初始化
engine.say('大家好')
engine.runAndWait()

另一种文本转语音方法。


from win32com.client import Dispatch
speaker = Dispatch('SAPI.SpVoice')    #创建Dispatch对象
speaker.Speak('大家好')        #调用Speak方法
del speaker     #释放

这种方法可能会报错,

ImportError: DLL load failed while importing win32api: 找不到指定的模块。

网站下载与自己安装的 “Python" 版本相适应的 "pywin32" 安装程序。

使用SpeechLib完成文本转换语言


from comtypes.client import CreateObject
from comtypes.gen import SpeechLib

engine = CreateObject('SAPI.SpVoice')   #调用方法
stream = CreateObject('SAPI.SpFileStream')   #输出到目标对象的流
infile = '1.txt'   #要读取的文本
outfile = 'demo_audio.wav'   #输出到语音文件
stream.open(outfile,SpeechLib.SSFMCreateForWrite)
engine.AudioOutputStream = stream
#读取文本内容
f = open(infile,'r',encoding='utf-8')
theText = f.read()
f.close()
engine.speak(theText)
stream.close()

使用PocketSphinx将语音转换成文本

首先安装两个工具包


pip install PocketSphinx
pip install SpeechRecognition

然后下载cmusphinx-zh-cn-5.2.tar中文识别的放到anaconda的python虚拟环境的目录下

Lib\site-packages\speech_recognition\pocketsphinx-data路径下

解压文件重命名为zh-CN


#将语音转换成文本 使用PocketSphinx
import speech_recognition as sr
audio_file = 'demo_audio.wav'
r = sr.Recognizer()
with sr.AudioFile(audio_file) as source:   #打开语音文件并读取
   audio = r.record(source)
try:
   print('文本内容:',r.recognize_sphinx(audio))   #默认识别成英文
   print('文本内容:',r.recognize_sphinx(audio,language='zh-CN'))  #指定中文
except Exception as e:
   print(e)

来源:https://blog.csdn.net/qq_34904125/article/details/120809485

0
投稿

猜你喜欢

手机版 网络编程 asp之家 www.aspxhome.com