在现在的生活之中,音频转为文本和文字是很常用和常见的一个功能的,那么大家在使用它时有没有想过这个功能是如何实现的呢。而这篇文章就是会来给大家讲解一下python音频转文字使用的库和方法,感兴趣的小伙伴继续往下阅读吧。
一、speechrecognition库
这是一个专门为python程序开发出来的音频转文字第三方库,它提供了多种不同的接口和模型来完成音频识别并将其转为对应文本。而且它在使用时还可以从互联网上抓取数据来识别音频,这让它对不同语音和语言的音频识别范围扩大。
但是在使用之前还是需要通过pip工具将其给下载安装好,它在安装之前需要去安装必须的依赖项才可以,命令如下所示:
pip install pocketsphinx pip install speechrecognition
如果第一个库安装命令执行失败的话,那么就是它还没有上传到python库和模块官网上面。需要自己手动从下面这个链接将wheel压缩包文件下载好,然后再调用该命令安装,如下所示:
https://www.lfd.uci.edu/~gohlke/pythonlibs/
二、使用speechrecognition库完成音频转文字
因为在这个第三方库中许多的接口调用都是要联网并且通过注册来获取权限的,所以在大部分时间使用的都是recognize_sphinx()这个能够在离线环境下执行作用的方法。
那么这个方法在识别音频文件时对于文件类型是有要求的,只支持wav、AIFF、FlAc等格式,如果是MP3文件还需要先经过类型转换才可以。读取文件之后调用方法就可以识别了,详细代码示例如下所示:
import speech_recognition as sr def wav2txt(wavfilepath): r = sr.Recognizer() sudio = '' with sr.AudioFile(wavfilepath) as src: sudio = r.record(src) print(r.recognize_sphinx(sudio)) if name == 'main': wav2txt("\WEB\static\output.wav")
以上就是关于“Python音频转文字用什么库?Python音频识别文本怎么做”的全部内容了,希望对你有所帮助。
更多python相关文章请访问分类:python
【版权声明】本文图文出自大盘站@dapan.cc,转载请注明出处!
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。