3G時(shí)代語音識別成本仍然是“攔路虎”
2009/06/10
“跑遍了京城的兒童玩具市場,竟然找不到幾款能夠順利完成語音對話的玩具娃娃”,這是六一前夕記者遭遇到的尷尬。無獨(dú)有偶,此前中科院自動化所以31萬元的價(jià)格,為四川科技館定做的能根據(jù)人類語音命令來完成畫像的特種機(jī)器人“貝奇”,可惜只是展示和娛樂觀眾。鄭裕慶
“一直以來,語音控制模塊的成本因素似乎都是阻礙語音識別技術(shù)接近普通消費(fèi)者的“攔路虎!盢uance大中華區(qū)總經(jīng)理鄭裕慶告訴《通信產(chǎn)業(yè)報(bào)》(網(wǎng))記者。
Nuance全球?qū)ふ彝黄瓶?/strong>
鄭裕慶對《通信產(chǎn)業(yè)報(bào)》(網(wǎng))記者表示,“早在三年前我們已經(jīng)和索尼公司合作,進(jìn)軍到了兒童電子玩具市場。由于兒童玩具語音對話功能涉及到產(chǎn)業(yè)鏈的數(shù)個企業(yè),而且成本較高,因此,目前這個市場處于雛形階段,今后開發(fā)前景大有可為”。
Nuance移動-企業(yè)事業(yè)部及消費(fèi)者服務(wù)事業(yè)部總裁史蒂夫·錢伯斯告訴《通信產(chǎn)業(yè)報(bào)》(網(wǎng))記者,語音識別技術(shù)在世界上許多國家都有其應(yīng)用,目前,全球超過2/3的財(cái)富100強(qiáng)企業(yè)采用了Nuance的解決方案,超過2.5億臺設(shè)備內(nèi)置了Nuance移動語音處理設(shè)備。
史蒂夫·錢伯斯
在通信領(lǐng)域,包括AT&T、Verizon、LG電子、諾基亞、摩托羅拉,在終端上都載入了語音識別的技術(shù),在航空方面應(yīng)也比較廣泛。如今,包括美國航空公司在內(nèi)全球多家航空公司采用了語音識別系統(tǒng)軟件。
業(yè)內(nèi)人士分析,語音識別技術(shù)有兩個方向:一是大詞匯量連續(xù)語音識別系統(tǒng),主要應(yīng)用于計(jì)算機(jī)的聽寫機(jī),以及與電話網(wǎng)或者互聯(lián)網(wǎng)相結(jié)合的語音信息查詢服務(wù)系統(tǒng),這些系統(tǒng)都是在計(jì)算機(jī)平臺上實(shí)現(xiàn)的;另外一個重要的方向是小型化、便攜式語音產(chǎn)品的應(yīng)用,如手機(jī)撥號、汽車設(shè)備的語音控制、智能玩具、家電遙控等方面的應(yīng)用,這些應(yīng)用系統(tǒng)大都使用專門的硬件系統(tǒng)實(shí)現(xiàn)。近幾年來迅速發(fā)展的語音信號處理專用芯片和語音識別片上系統(tǒng)的出現(xiàn),為語音識別的廣泛應(yīng)用創(chuàng)造了有利的條件。
中國市場方興未艾
目前,語音識別技術(shù)在中國金融系統(tǒng)應(yīng)用曙光初現(xiàn)。
“語音軟件目前應(yīng)用屬于初級階段。主要是大多是手機(jī)銀行和電話銀行根據(jù)用戶的聲音辨別真?zhèn)。估?jì)今后可能拓展到更寬泛的領(lǐng)域”。中國建設(shè)銀行數(shù)據(jù)服務(wù)中心的負(fù)責(zé)人表示,語音軟件在身份認(rèn)證、賬單支付、個人數(shù)據(jù)修復(fù)等應(yīng)用效果明顯。
目前,通過語音識別技術(shù)在中國移動增值業(yè)務(wù)上有所突破。此前,江蘇移動、山東移動等電信運(yùn)營商,已經(jīng)實(shí)現(xiàn)了用戶通過“哼”一段旋律,就能查找到自己聽過卻不知道名稱的歌曲或彩鈴,并且進(jìn)行點(diǎn)播和下載的新業(yè)務(wù)。
“這種大規(guī)模的商業(yè)應(yīng)用,已經(jīng)進(jìn)入了成熟階段!敝锌圃郝晫W(xué)所語音實(shí)驗(yàn)室有關(guān)人士表示,在商業(yè)應(yīng)用上,這套系統(tǒng)最關(guān)鍵的部分是解決了計(jì)費(fèi)環(huán)節(jié)的問題,電信運(yùn)營商和聲學(xué)所,由此可以按照每條查詢的下載量來進(jìn)行按比例分賬。
“中國擁有超過近8億移動用戶,占全球最大的流動電話市場!卞X伯斯對中國的3G市場充滿了期待。據(jù)其透露,Nuance目前已和包括中國銀行在內(nèi)六家銀行達(dá)成了協(xié)議,未來語音系統(tǒng)將全面發(fā)力中國市場。
語音識別技術(shù)壁壘猶存
據(jù)媒體報(bào)道,2006年,中國電信推出的號碼百事通新業(yè)務(wù),就是一款整合用戶號碼信息的基礎(chǔ)上,針對用戶的模糊查詢等信息服務(wù)需求提供的新產(chǎn)品?上У氖悄:樵儯Ч患,現(xiàn)行的“號碼百事通”業(yè)務(wù)還需要靠人工接線來實(shí)現(xiàn),這必然需要投入大量資金來建設(shè)和不斷完善呼叫中心。
錢伯斯表示,今后將加大中國市場的開拓力度和在中國的投入,今年Nuance中國的員工將增加一倍,并加大研發(fā)力度,提高中國語言識別的準(zhǔn)確率。
目前,國際上Google和微軟在語音識別技術(shù)上競爭激烈。世界上只有少數(shù)幾家公司能夠形成核心技術(shù),而中科院聲學(xué)所是國內(nèi)唯一完全擁有核心自主技術(shù)的單位,目前其最大的競爭對手主要是美國的Nuance公司。
在金融危機(jī)仍籠罩全球之時(shí),恰逢中國3G元年,語音識別技術(shù)的應(yīng)用將是一個千載難逢的機(jī)會。但是,突破這個壁壘也需要一個長期的過程。
通信產(chǎn)業(yè)網(wǎng)