【CTI論壇企業(yè)專訪】
專訪科大訊飛吳曉如:語音云服務(wù) 深入千家萬戶
曹建菊 2012/03/27
每一部手機(jī)都將具備能聽會說的功能;
每一臺家電都將具備能聽會說的功能;
每一臺轎車都將具備能聽會說的功能;
每一個玩具都將具備能聽會說的功能;
……
這是安徽科大訊飛信息科技股份有限公司高級副總裁吳曉如先生在接受CTI論壇記者專訪時,為我描繪出的語音遠(yuǎn)景,而在此之前的若干年,語音應(yīng)用雖然已得到行業(yè)人士足夠的重視,但真正落地?zé)o疑與移動互聯(lián)網(wǎng)的飛速發(fā)展有著密不可分的關(guān)系。
圖:安徽科大訊飛信息科技股份有限公司高級副總裁吳曉如先生
訊飛“語音云”
正如創(chuàng)新工場CEO 李開復(fù)在科大訊飛“語音點(diǎn)亮生活” 、“新一代語音云發(fā)布暨語音開發(fā)者大會”上闡述的:“過去總說語音改變世界,為什么一直沒有改?一方面是云計算還沒有達(dá)到很高的水平。第二,語音在過去二三十年總是不知道應(yīng)用在哪里。第三個挑戰(zhàn)過去存在以后還會存在,那就是假如能做到一定語義的理解,需要花盡可能少的時間讓開發(fā)者迅速介入。而第四個挑戰(zhàn)則是用戶體驗和用戶的期望值,語音是人類最自然彼此溝通的方式,所以人們一旦開始用語音交流了,就表示人們把機(jī)器當(dāng)做一個‘人’了,這樣高的期望值將給開發(fā)者帶來更大挑戰(zhàn)。”
上述挑戰(zhàn)讓語音應(yīng)用在相當(dāng)長時期內(nèi)限于部分玩具、車載導(dǎo)航等領(lǐng)域,而讓聲音穿越障礙,得到自由交流是科大訊飛一直的夢想。
同時,為讓更多的中國人、更多的中國企業(yè)使用上訊飛語音,2010年10月,科大訊飛啟動了“語音云”開發(fā)者計劃。訊飛“語音云”,是基于云計算技術(shù)基礎(chǔ),將業(yè)界領(lǐng)先的智能語音技術(shù)向互聯(lián)網(wǎng)開發(fā)者開放,為各類移動互聯(lián)網(wǎng)創(chuàng)業(yè)者和創(chuàng)新性企業(yè)提供低門檻的語音技術(shù)服務(wù),合作伙伴可以像使用水、電那樣“即開即有、按需取用”,在很短時間內(nèi)構(gòu)建出支持自然語音交互功能的特色移動互聯(lián)網(wǎng)應(yīng)用。
而在不到一年半的時間里,吳曉如說:“我們的開發(fā)者伙伴已達(dá)到3100個,終端用戶數(shù)達(dá)到3000萬,每天在線用戶數(shù)超120萬,總請求量超過700萬次,涵蓋移動互聯(lián)網(wǎng)、游戲、汽車、通信、金融、學(xué)校等領(lǐng)域,吸引了工程師、IT技術(shù)人員甚至學(xué)生的積極參與。在手機(jī)、呼叫中心、車載、互聯(lián)網(wǎng)電視、智能家電等各領(lǐng)域得到創(chuàng)新應(yīng)用,‘語音云’服務(wù)已深入千家萬戶、日常生活!
訊飛新一代“語音云”
吳曉如介紹,相比較于第一代“語音云”,科大訊飛新一代“語音云”平臺更健全穩(wěn)固,能夠處理更復(fù)雜的業(yè)務(wù),并能服務(wù)于更多的用戶,此外,新一代語音云將開放個性化識別、個性化合成、自然語言理解、聲紋識別、口語評測等接口。
吳曉如強(qiáng)調(diào):“新一代‘語音云’主要有三個關(guān)注點(diǎn),一是不斷提升的核心語音技術(shù):新一代訊飛語音云引入了取得新突破的語音技術(shù),無論是語音合成、語音識別、語音轉(zhuǎn)寫目前都是業(yè)界領(lǐng)先的,僅在2011年,我們這方面的專利技術(shù)就超過百個。第二個關(guān)注點(diǎn)是訊飛語音技術(shù)種類豐富,除了剛才提到的語音合成、語音識別、語音轉(zhuǎn)寫技術(shù)外,還添加了聲紋識別、口語評測、自然語言理解技術(shù),行業(yè)用戶可以在新的語音云中獲得更多的語音服務(wù)種類,也可根據(jù)自身的特點(diǎn)進(jìn)行有機(jī)的組合,擴(kuò)展應(yīng)用和服務(wù)的多樣性。第三個關(guān)注點(diǎn)是更加個性化的語音技術(shù),能有針對性的解決在實際應(yīng)用中不同用戶語音服務(wù)的獨(dú)特性,同時也滿足現(xiàn)在移動互聯(lián)網(wǎng)用戶的個性化需求,讓語音交互更加生動。”
語義理解,在人和人的交流中,主要基于人互動時的表情、手勢、語調(diào)等的交流,來實現(xiàn)對語義的具體判斷,而科大訊飛的語義理解技術(shù)到底會有多高的識別率?
吳曉如進(jìn)一步解釋:“語義理解技術(shù)目前仍是對一些固定領(lǐng)域、有著特定明確表述的信息進(jìn)行識別。科大訊飛通過將語言扁平化,對于應(yīng)用需求明確的語義理解識別率較高!
訊飛語音在呼叫中心的應(yīng)用
隨著金融行業(yè)呼叫中心對應(yīng)用需求越來越明確,相比較于傳統(tǒng)按鍵式菜單,IVR服務(wù)就顯得越來越冗長、繁瑣、復(fù)雜,已嚴(yán)重影響用戶體驗。而語音識別呼叫中心導(dǎo)航技術(shù)可以讓用戶直接說出需求,即可辦理業(yè)務(wù),如希望查詢賬戶余額,只需說出“查詢余額”或者“我手機(jī)上還有多少錢?”系統(tǒng)就可以理解用戶的意圖,并引導(dǎo)用戶辦理該業(yè)務(wù)。
因此,訊飛語音識別呼叫中心導(dǎo)航技術(shù)已經(jīng)在工商銀行電話銀行中得到了應(yīng)用,并已經(jīng)在大連、廈門、青島、寧波等地區(qū)上線。另外,中信銀行電話銀行也已經(jīng)在北京、深圳、天津、武漢、合肥、貴陽、哈爾濱、呼和浩特等地區(qū)上線。
那么,在各個企業(yè),行業(yè)不同,業(yè)務(wù)類型不同,呼叫中心平臺及業(yè)務(wù)接入有著千差萬別,語音接入是否會非常困難呢?吳曉如指出:“目前科大訊飛的語音產(chǎn)品可與主流的呼叫中心平臺,如華為、中興、Avaya、Edify、Genesys等進(jìn)行系統(tǒng)集成,可以有效支持在這些平臺下的語音應(yīng)用,針對不同行業(yè)的不同應(yīng)用情況,科大訊飛成立了專門的項目實施團(tuán)隊,承接著效果優(yōu)化、用戶交互設(shè)計等工作,提供個性化服務(wù),保證項目成功!
語音技術(shù)在呼叫中心中的未來應(yīng)用前景到底怎樣?吳曉如給出了很肯定的答復(fù):“國外呼叫中心應(yīng)用智能語音技術(shù)已經(jīng)非常普遍,國內(nèi)的重點(diǎn)行業(yè)也都已經(jīng)開始使用科大訊飛的智能語音技術(shù),并已初見成效。客戶能夠利用全新自助語音服務(wù)解決方案來處理日益增長的信息咨詢、電子交易和客戶服務(wù)需求,并能幫助用戶在任何時候、任何地點(diǎn)通過隨處可得的電話輕松自然的獲得信息與服務(wù)!
吳曉如最后表示:“接下來在未來5年內(nèi),科大訊飛將持續(xù)提升語音技術(shù)水平,為建設(shè)更加智能的呼叫中心自助服務(wù)渠道提供源源不斷的動力。”
聲明:CTI論壇(CTiforum)版權(quán)作品,未經(jīng)CTiforum書面授權(quán),嚴(yán)禁轉(zhuǎn)載,違者將被追究法律責(zé)任。
CTI論壇報道
相關(guān)閱讀: