語音識別

語音識別的發(fā)展史

　　早在計算機發(fā)明之前，自動語音識別的設(shè)想就已經(jīng)被提上了議事日程，早期的聲碼器可被視作語音識別及合成的雛形。而1920年代生產(chǎn)的"Radio Rex"玩具狗可能是最早的語音識別器，當(dāng)這只狗的名字被呼喚的時候，它能夠從底座上彈出來。最早的基于電子計算機的語音識別系統(tǒng)是由AT&T貝爾實驗室開發(fā)的Audrey語音識別系統(tǒng)，它能夠識別10個英文數(shù)字。其識別方法是跟蹤語音中的共振峰。該系統(tǒng)得到了98%的正確率。到1950年代末，倫敦學(xué)院（Colledge of London）的Denes已經(jīng)將語法概率加入語音識別中。

　　1960年代，人工神經(jīng)網(wǎng)絡(luò)被引入了語音識別。這一時代的兩大突破是線性預(yù)測編碼Linear Predictive Coding （LPC），及動態(tài)時間彎折Dynamic Time Warp技術(shù)。

　　語音識別技術(shù)的最重大突破是隱含馬爾科夫模型Hidden Markov Model的應(yīng)用。從Baum提出相關(guān)數(shù)學(xué)推理，經(jīng)過Labiner等人的研究，卡內(nèi)基梅隆大學(xué)的李開復(fù)最終實現(xiàn)了第一個基于隱馬爾科夫模型的大詞匯量語音識別系統(tǒng)Sphinx。此后嚴(yán)格來說語音識別技術(shù)并沒有脫離HMM框架。

　　盡管多年來研究人員一直嘗試將“聽寫機”推廣，語音識別技術(shù)在目前還無法支持無限領(lǐng)域，無限說話人的聽寫機應(yīng)用。

語音識別的現(xiàn)狀

　　作為一種軟件產(chǎn)品，Microsoft已圍繞語音識別技術(shù)進行了長達數(shù)年之久的研發(fā)工作。如需了解更多關(guān)于語言識別產(chǎn)品當(dāng)前進展情況的信息，請訪問Microsoft .NET語音技術(shù)Web站點。

　　與此同時，Microsoft將繼續(xù)在語音識別研究領(lǐng)域進行投資。位于雷蒙德和中國的研發(fā)團隊正致力于解決困擾語音識別領(lǐng)域的某些技術(shù)缺陷。其中，一個稱作Dr. Who的研究項目旨在解決噪音問題，力求確保您的計算機能夠在辦公場所以外的嘈雜環(huán)境（例如汽車或人流較多的餐館內(nèi)）中識別語音信息。

語音識別的應(yīng)用

　　語音識別技術(shù)的應(yīng)用包括語音撥號、語音導(dǎo)航、室內(nèi)設(shè)備控制、語音文檔檢索、簡單的聽寫數(shù)據(jù)錄入等。語音識別技術(shù)與其他自然語言處理技術(shù)如機器翻譯及語音合成技術(shù)相結(jié)合，可以構(gòu)建出更加復(fù)雜的應(yīng)用，例如語音到語音的翻譯。

　　語音識別技術(shù)所涉及的領(lǐng)域包括：信號處理、模式識別、概率論和信息論、發(fā)聲機理和聽覺機理、人工智能等等。

語音識別的目標(biāo)

　　語音-文本轉(zhuǎn)換（voice-to-text）軟件和自動電話服務(wù)等應(yīng)用背后的關(guān)鍵技術(shù)是語音識別。在這些應(yīng)用中語音識別準(zhǔn)確率是至關(guān)重要的，而為了做到這一點，語音-文本轉(zhuǎn)換軟件通常要求用戶在安裝過程中對軟件進行“訓(xùn)練”，軟件本身也要隨著時間的推移慢慢適應(yīng)用戶的語音模式。需要與多個說話者互動的自動語音服務(wù)則不允許存在使用者對軟件進行訓(xùn)練的環(huán)節(jié)，因為它們必須能夠在第一時間為任何用戶服務(wù)。為了解決識別準(zhǔn)確率較低的問題，這些系統(tǒng)要么只能處理很小的詞匯量，要么嚴(yán)格限制用戶可以使用的字句或模式。

　　自動語音識別的最終目標(biāo)是提供即買即用、可以自動快速適應(yīng)任何說話者的語音識別服務(wù)，這個系統(tǒng)不需要用戶訓(xùn)練就可以針對所有用戶和各種條件，良好地發(fā)揮功用。

　　“這個目標(biāo)在移動互聯(lián)網(wǎng)時代顯得尤為重要，”俞棟博士表示，“因為語音是智能手機和其他移動設(shè)備必不可缺的接口模式。雖然個人移動設(shè)備是采集和學(xué)習(xí)用戶語音的理想設(shè)備，但用戶只有在初始體驗，也就是在針對該用戶的模型建立之前的體驗非常良好時，才會繼續(xù)使用語音功能?！?/font>

　　非特定人語音識別技術(shù)對于沒有機會或辦法適應(yīng)用戶的語音識別系統(tǒng)也非常重要，例如在呼叫中心，來電者身份是未知的，而且通話時間只有幾秒鐘；又例如用戶可能會因為擔(dān)心隱私問題而不愿意在提供“語音-語音（speech-to-speech）”翻譯的網(wǎng)絡(luò)服務(wù)中留存語音樣本。

提問者：路交匯處地點：- 瀏覽次數(shù)：3016 提問時間：04-29 05:54

我有更好的答案

撰寫答案: 提交

1 / 3

相關(guān)電子百科: 硅膠板; 3D晶體管; 雙極性晶體管; 晶體管時間繼電器; 光敏電阻器

free性丰满hd毛多多,久久综合给合久久狠狠狠97色69 ,欧美成人乱码一区二区三区,国产美女久久久亚洲综合,7777久久亚洲中文字幕

語音識別

目錄

語音識別的發(fā)展史

語音識別的現(xiàn)狀

語音識別的應(yīng)用

語音識別的目標(biāo)