使用Python将语音转换为文本的方法
作者:Q:458831279 发布时间:2022-10-16 07:48:06
语音识别是计算机软件识别口语中的单词和短语,并将其转换为可读文本的能力。那么如何在 Python 中将语音转换为文本?如何使用 SpeechRecognition 库在 Python 中将语音转换为文本?我们不需要从头开始构建任何机器学习模型,该库为我们提供了各种著名的公共语音识别 API 的便捷包装。
使用 pip 安装库:
pip3 install SpeechRecognition
Okey,打开一个新的 Python 文件并导入它:
import speech_recognition as sr
从文件读取
确保当前目录中有一个包含英语语音的音频文件 (如果您想跟我一起学习,请在此处获取音频文件):
filename = “speech.wav”
该文件是从 LibriSpeech 数据集中获取的,但是您可以带上任何想要的东西,只需更改文件名,就可以初始化语音识别器:
# initialize the recognizer
r = sr.Recognizer()
以下代码负责加载音频文件,并使用 Google Speech Recognition 将语音转换为文本:
# open the filewith sr.AudioFile(filename) as source:www.zpedu.com/
# listen for the data (load audio to memory)
audio_data = r.record(source)
# recognize (convert from speech to text)
text = r.recognize_google(audio_data)
print(text)
这需要几秒钟才能完成,因为它将文件上传到 Google 并获取了输出,这是我的结果:
I believe you're just talking nonsense
从麦克风读取
这需要在您的计算机中安装 PyAudio,以下是取决于您的操作系统的安装过程:
视窗
您可以点安装它:
pip3 install pyaudio
的 Linux
您需要首先安装依赖项:
sudo apt-get install python-pyaudio python3-pyaudio
pip3 install pyaudio
苹果系统
您需要先安装 portaudio,然后才可以点安装它:
brew install portaudio
pip3 install pyaudio
现在,让我们使用麦克风转换语音:
with sr.Microphone() as source:
# read the audio data from the default microphone
audio_data = r.record(source, duration=5)
print(“Recognizing…”)
# convert speech to text
text = r.recognize_google(audio_data)
print(text)
这会从您的麦克风听到 5 秒钟,然后尝试将该语音转换为文本!
它与先前的代码非常相似,但是我们在这里使用 Microphone () 对象从默认麦克风读取音频,然后在 record () 函数中使用 duration 参数在 5 秒后停止读取,然后上传音频数据向 Google 获取输出文本。
您还可以在 record () 函数中使用 offset 参数在偏移几秒钟后开始记录。
另外,您可以通过将语言参数传递给 accept_google () 函数来识别不同的语言。例如,如果您想识别西班牙语语音,则可以使用:
text = r.recognize_google(audio_data, language=”es-ES”)
来源:https://blog.csdn.net/xiabiao1974/article/details/107729087


猜你喜欢
- 在 Class 块中,成员通过相应的声明语句被声明为 Private(私有成员,只能在类内部调用)
- 了解了上一篇的ADO.NET简介,我们就可以来对数据库进行增删改查等基本操作了!下面是每种操作的具体实现。先在自定义类的头部定义好数据库连接
- Mysql Explain 详解一.语法explain < table_name >例如: explain select * f
- 连接:mysql -h主机地址 -u用户名 -p用户密码 (注:u与root可以不用加空格,其它也一样)断开:exit (回车)创建授权:g
- parent.html 中的代码为:<iframe marginwidth="0"
- 在我们编程过程中,经常会用到与时间相关的各种务需求,下面来介绍 golang 中有关时间的一些基本用法,我们从 time 的几种 type
- 前言在之前实现的 JSON 解析器中当时只实现了将一个 JSON 字符串转换为一个 JSONObject,并没
- Notebook 修改字体和大小原理很简单,就是更改CSS文件原本的字体很难看,尤其是 引号😡我推荐两款字体,Consolas 和 Fira
- 本文实例为大家分享了vue文件树组件的实现方法,供大家参考,具体内容如下本文主要是分析vue官方仓库里的文件树组件[vue github]d
- 之前在微信企业号开发:微信考勤中使用了百度地图的定位组件,但发现在部分手机上会出现定位失败的提示,于是有研究了一下百度地图。原来使用的Web
- 一个日历控件,这是官方说明,,供大家参考,具体内容如下首先引入css样式<!--引入bootstrap 和bootstrap-date
- 本文实例讲述了PHP判断是否微信访问的方法。分享给大家供大家参考,具体如下:在开发中有时需要禁止或者仅允许微信浏览器进行访问,则此时就需要对
- 如果你不知道原因,不要过于担心,请研究CSS规则并查看这篇文章:使用CSS来修正一切: 20 +常见错误和修复。 如果这些也无效,您可以通过
- 一、 问题现象 在执行 SQL Server分布式事务时,在SQL Server 2005下收到如下错误: 消息 7391,级别 16,状态
- 函数的返回值返回结果要怎么做,多个结果又要怎么做# 函数返回值# 概念:函数执行完以后会返回一个对象,如果在函数内部有return 就可以返
- 一、背景我们项目开发人员写的文档都是markdown文件。对于其它组的同学要进行阅读不是很方便。每次编辑完markdown文件,我都是用软件
- python opencv把一张图片嵌入(叠加)到另一张图片上1、背景:最近做了个烟火生成系统的界面设计,需要将烟雾图片嵌入到任意一张图片中
- 大家都知道,linux里一切皆为文件,在linux/unix的根目录下,有个/proc目录,这个/proc 是一种内核和内核模块用来向进程(
- 一、下载git可以官网下载,傻瓜步骤安装就行下载好之后需要在idea中配置git,在File》settings》version Contro
- 一、json_encode()该函数主要用来将数组和对象,转换为json格式。先看一个数组转换的例子:$arr = array ('