欧美,精品,综合,亚洲,好吊妞视频免新费观看,免费观看三级吃奶,一级a片女人自慰免费看

 首頁 > 新聞 > 專家觀點 >

語音識別領域的“潛行者”

--專訪普強信息CEO何國濤、CTO李全忠

2014-06-30 16:37:29   作者:   來源:21CN股票   評論:0  點擊:


  問:何先生對語音識別不同的應用領域有什么想法?

  何國濤:ASR技術可以應用在很多領域:

  ·移動互聯網:盡管目前還沒有明晰獲利前景,但在未來卻有極大的市場潛能。這塊的競爭已經白熱化,許多實力玩家,像百度,騰訊,科大訊飛,云之聲,等等正在爭斗,未來還會有更多人加入進來。

  ·企業(yè)呼叫中心:要進入這個市場,企業(yè)不僅要有領先的ASR語音識別技術,同時還要有專業(yè)知識。普強則是這個領域的佼佼者。

  ·車載導航:這個領域ASR語音識別技術是必須的。銷售周期比較長,但是你一旦進入這個市場,你就擁有能做十年的客戶。

  ·教育領域:要有很強的政府背景和專業(yè)知識?拼笥嶏w在這塊有壓倒性的優(yōu)勢。

  ·聲紋識別領域:增強系統安全性能,這是今年語音識別的主要收入增長點。

  ·醫(yī)療保健領域:應用到電子病歷中,可自動實現把醫(yī)生的聲音轉換成文本。這一領域也是若干發(fā)達國家在語音識別的主要收入領域。

  由于擁有領先的語音識別技術,普強已經做好了進入這些領域的準備。普強將先鎖定在企業(yè)客戶這塊。當我們在這個領域做到最好時,我們再繼續(xù)滲透到其它版塊。

  普強目前擁有:

  千語語音平臺:向企業(yè)提供語音識別服務

  千語語音云平臺:為手機互聯網應用提供的語音識別云服務

  普強智能語音分析系統:為企業(yè)提供360度大數據分析(語音,視頻,文學數據等)

  問:ASR語音識別技術有哪些難點?

  李全忠:語音識別技術要求快速,準確。語音識別目前還達不到百分百準確,達到完美的距離還很遠。因為中文5千字中發(fā)音有406個,是最難辨識的語種,例如(wu),可以是吳、無、吾、梧、蜈等。同樣文字各地方言發(fā)音不一,便會增加難度,所以語音辯識應用的成功關鍵,更傾向是專業(yè)能力。人類有眼睛,耳朵,文字來幫助識別,語音識別是只通過能“聽”來完成,有限的聲音數據要用來識別聲音的同時也要區(qū)分不同的背景雜音,需要花時間和精力去完善核心算法和積累數據。為了使每個垂直領域達到最優(yōu)的識別效果,我們都需要積累經驗去適當調整算法和采集選擇數據,例如為呼叫中心的電話信道建立模型與移動互聯網的聲學模型是不一樣的。

  問:ASR技術怎么應用在智能家居設備和穿戴設備上?

  何國濤:在可穿戴設備上,語音識別技術將是必備技術之一,但是要應用ASR技術到可穿戴設備,我們首先要解決能耗問題,這類設備一般沒有太多電能。

  一個成功的案例是:低功耗的語音喚醒技術。它通過只針對特定人和少數命令詞的識別解決了低能耗的問題,成功應用在許多嵌入式產品中,例如:手機語音喚醒,寵物語音鎖鏈(鎖鏈回答寵物主人的叫喚)等。

分享到: 收藏

專題