首頁(yè)>>廠商>>語(yǔ)音板卡開發(fā)商>>Dialogic

英特爾推出新款語(yǔ)音識(shí)別軟件 加入面部識(shí)別功能

2003/05/02

  英特爾公司最近發(fā)布新款的語(yǔ)音識(shí)別軟件,這款軟件在語(yǔ)音識(shí)別的基礎(chǔ)上,加入了類似識(shí)別人類嘴唇的功能。這一功能的加入大大地提高了單靠語(yǔ)音識(shí)別軟件的準(zhǔn)確性。

  這款軟件的全名為可視音頻語(yǔ)音識(shí)別軟件(AVSR)。這款A(yù)VSR軟件可以提高語(yǔ)音識(shí)別軟件識(shí)別的準(zhǔn)確率。特別是在外界背景有噪音的情況下,這款軟件的作用就表現(xiàn)得更加明顯。

  AVSR軟件是通過(guò)攝像頭捕捉用戶嘴唇動(dòng)作,與此同時(shí)對(duì)聲音同步識(shí)別。AVSR通過(guò)這兩種方式的結(jié)合,提高了語(yǔ)音識(shí)別的準(zhǔn)確性。這也是也普通語(yǔ)音識(shí)別軟件的不同。

  AVSR是英特爾公司的OpenCV計(jì)算機(jī)可視庫(kù)的一個(gè)組成部分。AVSR在這個(gè)項(xiàng)目中的地位,是一個(gè)可視化的工具。OpenCV庫(kù)中包含了許多面部表情識(shí)別的算法。OpenCV是一個(gè)開放的源代碼庫(kù)。它的源代碼已經(jīng)被下載50萬(wàn)次。

  英特爾公司稱,隨著處理器速度的飛速發(fā)展,數(shù)碼相機(jī)的價(jià)格下降以及USB 2高速接入的技術(shù)的普及,目前的主流個(gè)人計(jì)算機(jī)已經(jīng)完全可以運(yùn)行這樣復(fù)雜的算法了。

新浪科技(tech.sina.com.cn)


相關(guān)鏈接:
Dialogic Corporation宣布完成NMS通信平臺(tái)業(yè)務(wù)的收購(gòu) 2008-12-08
Dialogic在中國(guó)開始了業(yè)務(wù)增長(zhǎng)的新階段 2008-11-18
訊鳥采用Dialogic HMP+數(shù)字接口卡打造托管型呼叫中心 2008-11-12
Dialogic:追求一如既往 創(chuàng)新更上層樓 2008-11-10
招行采用“Dialogic HMP+數(shù)字接口卡”升級(jí)電話銀行 2008-10-29

分類信息:  語(yǔ)音合成TTS_與_語(yǔ)音識(shí)別ASR     新聞?lì)l道   技術(shù)_語(yǔ)音合成_新聞   技術(shù)_語(yǔ)音識(shí)別_新聞