free性丰满hd毛多多,久久综合给合久久狠狠狠97色69 ,欧美成人乱码一区二区三区,国产美女久久久亚洲综合,7777久久亚洲中文字幕

0
問答首頁 最新問題 熱門問題 等待回答標(biāo)簽廣場
我要提問

電子百科

語音識別

語音識別

語音識別的發(fā)展史

  •   早在計算機發(fā)明之前,自動語音識別的設(shè)想就已經(jīng)被提上了議事日程,早期的聲碼器可被視作語音識別及合成的雛形。而1920年代生產(chǎn)的"Radio Rex"玩具狗可能是最早的語音識別器,當(dāng)這只狗的名字被呼喚的時候,它能夠從底座上彈出來。最早的基于電子計算機的語音識別系統(tǒng)是由AT&T貝爾實驗室開發(fā)的Audrey語音識別系統(tǒng),它能夠識別10個英文數(shù)字。其識別方法是跟蹤語音中的共振峰。該系統(tǒng)得到了98%的正確率。到1950年代末,倫敦學(xué)院(Colledge of London)的Denes已經(jīng)將語法概率加入語音識別中。

      1960年代,人工神經(jīng)網(wǎng)絡(luò)被引入了語音識別。這一時代的兩大突破是線性預(yù)測編碼Linear Predictive Coding (LPC), 及動態(tài)時間彎折Dynamic Time Warp技術(shù)。

      語音識別技術(shù)的最重大突破是隱含馬爾科夫模型Hidden Markov Model的應(yīng)用。從Baum提出相關(guān)數(shù)學(xué)推理,經(jīng)過Labiner等人的研究,卡內(nèi)基梅隆大學(xué)的李開復(fù)最終實現(xiàn)了第一個基于隱馬爾科夫模型的大詞匯量語音識別系統(tǒng)Sphinx。此后嚴(yán)格來說語音識別技術(shù)并沒有脫離HMM框架。

      盡管多年來研究人員一直嘗試將“聽寫機”推廣,語音識別技術(shù)在目前還無法支持無限領(lǐng)域,無限說話人的聽寫機應(yīng)用。

語音識別的現(xiàn)狀

  •   作為一種軟件產(chǎn)品,Microsoft已圍繞語音識別技術(shù)進行了長達數(shù)年之久的研發(fā)工作。如需了解更多關(guān)于語言識別產(chǎn)品當(dāng)前進展情況的信息,請訪問Microsoft .NET語音技術(shù)Web站點。

      與此同時,Microsoft將繼續(xù)在語音識別研究領(lǐng)域進行投資。位于雷蒙德和中國的研發(fā)團隊正致力于解決困擾語音識別領(lǐng)域的某些技術(shù)缺陷。其中,一個稱作Dr. Who的研究項目旨在解決噪音問題,力求確保您的計算機能夠在辦公場所以外的嘈雜環(huán)境(例如汽車或人流較多的餐館內(nèi))中識別語音信息。

語音識別的應(yīng)用

  •   語音識別技術(shù)的應(yīng)用包括語音撥號、語音導(dǎo)航、室內(nèi)設(shè)備控制、語音文檔檢索、簡單的聽寫數(shù)據(jù)錄入等。語音識別技術(shù)與其他自然語言處理技術(shù)如機器翻譯及語音合成技術(shù)相結(jié)合,可以構(gòu)建出更加復(fù)雜的應(yīng)用,例如語音到語音的翻譯。

      語音識別技術(shù)所涉及的領(lǐng)域包括:信號處理、模式識別、概率論和信息論、發(fā)聲機理和聽覺機理、人工智能等等。

語音識別的目標(biāo)

  •   語音-文本轉(zhuǎn)換(voice-to-text)軟件和自動電話服務(wù)等應(yīng)用背后的關(guān)鍵技術(shù)是語音識別。在這些應(yīng)用中語音識別準(zhǔn)確率是至關(guān)重要的,而為了做到這一點,語音-文本轉(zhuǎn)換軟件通常要求用戶在安裝過程中對軟件進行“訓(xùn)練”,軟件本身也要隨著時間的推移慢慢適應(yīng)用戶的語音模式。需要與多個說話者互動的自動語音服務(wù)則不允許存在使用者對軟件進行訓(xùn)練的環(huán)節(jié),因為它們必須能夠在第一時間為任何用戶服務(wù)。為了解決識別準(zhǔn)確率較低的問題,這些系統(tǒng)要么只能處理很小的詞匯量,要么嚴(yán)格限制用戶可以使用的字句或模式。

      自動語音識別的最終目標(biāo)是提供即買即用、可以自動快速適應(yīng)任何說話者的語音識別服務(wù),這個系統(tǒng)不需要用戶訓(xùn)練就可以針對所有用戶和各種條件,良好地發(fā)揮功用。

      “這個目標(biāo)在移動互聯(lián)網(wǎng)時代顯得尤為重要,”俞棟博士表示,“因為語音是智能手機和其他移動設(shè)備必不可缺的接口模式。雖然個人移動設(shè)備是采集和學(xué)習(xí)用戶語音的理想設(shè)備,但用戶只有在初始體驗,也就是在針對該用戶的模型建立之前的體驗非常良好時,才會繼續(xù)使用語音功能?!?/font>

      非特定人語音識別技術(shù)對于沒有機會或辦法適應(yīng)用戶的語音識別系統(tǒng)也非常重要,例如在呼叫中心,來電者身份是未知的,而且通話時間只有幾秒鐘;又例如用戶可能會因為擔(dān)心隱私問題而不愿意在提供“語音-語音(speech-to-speech)”翻譯的網(wǎng)絡(luò)服務(wù)中留存語音樣本。

提問者:路交匯處 地點:- 瀏覽次數(shù):3016 提問時間:04-29 05:54
我有更好的答案
提 交
撰寫答案
提 交