【Python語音識(shí)別轉(zhuǎn)中文怎么做?Python如何識(shí)別音頻并轉(zhuǎn)為中文文本】在之前的文章中小編已經(jīng)給大家介紹過了python該怎么去實(shí)現(xiàn)音頻轉(zhuǎn)文字 , 但是它只能夠識(shí)別英語而無法去將普通話給識(shí)別成中文 。而下面要來介紹的內(nèi)容就是python音頻識(shí)別轉(zhuǎn)中文的方法教程 , 感興趣和想學(xué)習(xí)的小伙伴就要繼續(xù)往下閱讀文章了 。

1.python內(nèi)音頻轉(zhuǎn)文字一般使用的都是第三方庫(kù)speechrecognition , 而它在安裝之前還是需要去安裝一個(gè)配置項(xiàng)pocketsphinx , 此配置項(xiàng)就決定了音頻轉(zhuǎn)文字庫(kù)能夠去識(shí)別的語言有哪些 。所以首先通過pip命令將它們都下載安裝好 , 這樣才能執(zhí)行下一步操作 。
2.因?yàn)閜ocketsphinx內(nèi)自帶的音頻識(shí)別只支持英語 , 所以還需要去下載另外的插件才可以 。打開瀏覽器并定位到網(wǎng)址欄 , 復(fù)制下方的網(wǎng)址后粘貼并進(jìn)入 , 鏈接如下所示:
https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/Mandarin/在這個(gè)網(wǎng)頁之中找到以cn為結(jié)尾的tar.gz壓縮文件下載下來 , 注意需要選擇版本最新的那一個(gè) , 否則可能會(huì)出現(xiàn)不匹配而無法使用的情況 。
3.下載完成之后需要將它們先解壓到桌面方便復(fù)制 , 解壓完成之后會(huì)有一個(gè)三級(jí)的文件目錄 。按照從外向里的順序找到文件夾和文件將它們進(jìn)行重命名 , 示例如下:
cmusphinx-zh-cn-5.2>zh-CNcmusphinx-zh-cn-5.2>acoustic-modelzh_cn.lm.bin>language-model.lm.binzh_cn.dic>pronounciation-dictionary.dict4.重命名完成之后將這個(gè)zh-CN文件夾復(fù)制并且粘貼在python安裝目錄內(nèi)的指定目錄中 , 如下所示:
python3.6/site-packages/speech_recognition/pocketsphinx-data然后在編寫代碼時(shí)將模塊導(dǎo)入并且去調(diào)用recoginze_sphinx()這個(gè)識(shí)別音頻轉(zhuǎn)為文字的方法 , 不過需要在方法之中將參數(shù)language的值設(shè)置為中文才可以 , 詳細(xì)代碼示例如下所示:
import speech_recognition as srr = sr.Recognizer()sudio = ’’with sr.AudioFile(‘output.wav’) as src: sudio = r.record(src)print(recoginze_sphinx(sudio,language=“zh-CN”))以上就是關(guān)于“Python語音識(shí)別轉(zhuǎn)中文怎么做?Python如何識(shí)別音頻并轉(zhuǎn)為中文文本”的全部?jī)?nèi)容了 , 希望對(duì)你有所幫助 。
猜你喜歡
- 奧拉星手游初心識(shí)別碼在哪 初心識(shí)別碼獲取攻略
- ios14設(shè)置里找不到來電身份識(shí)別
- 如何關(guān)閉lol自帶的QT語音
- 絕地求生怎么快速切換語音頻道
- 英雄聯(lián)盟如何關(guān)閉電視臺(tái)或QT語音
- 營(yíng)業(yè)執(zhí)照OCR掃描識(shí)別 可解決錄入難題
- 華為智能語音在哪里下載
- 如何重新進(jìn)行人臉識(shí)別
- 手機(jī)微信收款語音播報(bào)怎么設(shè)置 手機(jī)微信收款語音播報(bào)如何設(shè)置
- 能語音的手游有哪些
