首頁>>廠商>>語音板卡開發(fā)商>>Dialogic

英特爾推出新款語音識別軟件 加入面部識別功能

2003/05/02

  英特爾公司最近發(fā)布新款的語音識別軟件,這款軟件在語音識別的基礎(chǔ)上,加入了類似識別人類嘴唇的功能。這一功能的加入大大地提高了單靠語音識別軟件的準確性。

  這款軟件的全名為可視音頻語音識別軟件(AVSR)。這款A(yù)VSR軟件可以提高語音識別軟件識別的準確率。特別是在外界背景有噪音的情況下,這款軟件的作用就表現(xiàn)得更加明顯。

  AVSR軟件是通過攝像頭捕捉用戶嘴唇動作,與此同時對聲音同步識別。AVSR通過這兩種方式的結(jié)合,提高了語音識別的準確性。這也是也普通語音識別軟件的不同。

  AVSR是英特爾公司的OpenCV計算機可視庫的一個組成部分。AVSR在這個項目中的地位,是一個可視化的工具。OpenCV庫中包含了許多面部表情識別的算法。OpenCV是一個開放的源代碼庫。它的源代碼已經(jīng)被下載50萬次。

  英特爾公司稱,隨著處理器速度的飛速發(fā)展,數(shù)碼相機的價格下降以及USB 2高速接入的技術(shù)的普及,目前的主流個人計算機已經(jīng)完全可以運行這樣復(fù)雜的算法了。

新浪科技(tech.sina.com.cn)


相關(guān)鏈接:
Dialogic Corporation宣布完成NMS通信平臺業(yè)務(wù)的收購 2008-12-08
Dialogic在中國開始了業(yè)務(wù)增長的新階段 2008-11-18
訊鳥采用Dialogic HMP+數(shù)字接口卡打造托管型呼叫中心 2008-11-12
Dialogic:追求一如既往 創(chuàng)新更上層樓 2008-11-10
招行采用“Dialogic HMP+數(shù)字接口卡”升級電話銀行 2008-10-29

分類信息:  語音合成TTS_與_語音識別ASR     新聞頻道   技術(shù)_語音合成_新聞   技術(shù)_語音識別_新聞