搜狗8月3日發(fā)布語音交互引擎“知音”,不僅“能聽會說”,還具有“能理解會思考”的能力。搜狗CTO楊洪濤介紹,智能語音技術已經(jīng)成功應用到搜狗的全線產(chǎn)品中,“知音”將在物聯(lián)網(wǎng)、車聯(lián)網(wǎng)、人工智能等各個方面得到應用,并布局到更多的終端入口。無獨有偶,兩天后微軟發(fā)布了第四代微軟“小冰”,包含實時情感決策對話引擎、多種新感官、中日英三種語言,對應不同領域的功能插件平臺,展現(xiàn)了微軟最新的人工智能技術。
隨著需求不斷擴大,以大數(shù)據(jù)、云計算、移動互聯(lián)網(wǎng)等技術為支撐的智能語音產(chǎn)業(yè)迅速發(fā)展,語音技術廠商和IT巨頭也大力布局人工智能領域,帶動全球智能語音產(chǎn)業(yè)規(guī)模進一步提升。中國語音產(chǎn)業(yè)信息網(wǎng)日前發(fā)布的《2015中國智能語音產(chǎn)業(yè)發(fā)展白皮書》指出,2015年,全球智能語音產(chǎn)業(yè)規(guī)模達61.2億美元,同比增34.2%。其中,中國智能語音產(chǎn)業(yè)規(guī)模達到40.3億元,同比增41%,遠高于全球語音產(chǎn)業(yè)增長速度。預計到2016年年底,中國語音產(chǎn)業(yè)規(guī)模將達到59億元。
“中國智能語音產(chǎn)業(yè)發(fā)展迅速,呈現(xiàn)幾大亮點,表現(xiàn)為產(chǎn)品更加準確、更懂消費者,產(chǎn)品載體變得更多。”賽迪顧問高級分析師向陽告訴《經(jīng)濟日報》記者,目前阿里的智能音箱、蘋果的Siri語音助手等產(chǎn)品,語音識別準確度已達97%左右。在軟件方面,智能語音客服發(fā)展較快,比如中國移動等推出了智能呼叫中心。在硬件方面,亞馬遜推出了Echo智能音響,長虹發(fā)布了人工智能電視,科大訊飛則有整套語音交互解決方案。軟硬件技術的提升,使得產(chǎn)品的載體更加豐富。
智能語音發(fā)揮的正是搜索引擎介入互聯(lián)網(wǎng)的入口功能,隨著識別技術的進步,用戶的體驗才更加便捷。比如,“知音”引擎解決了用戶語速過快導致的吞音問題,將語音識別錯誤率下降了30%以上,語音識別速度提升了3倍。“知音”引擎還能支持多輪對話,處理更復雜的用戶交互邏輯,提供更便捷的人性化服務。比如用戶說“我要去首都機潮,它會問“是T1還是T2”;當用戶確定航站樓后,它還會問“是出發(fā)還是接人”。
“大環(huán)境推動了我國智能語音產(chǎn)業(yè)迅速發(fā)展。”向陽分析說,在國外,谷歌等公司把發(fā)展智能語音作為商業(yè)計劃來推進;在國內(nèi),智能硬件產(chǎn)品不斷推廣,智能語音產(chǎn)品嫁接起來更為便捷。此外,從政策上看,“互聯(lián)網(wǎng)+”“人工智能”等戰(zhàn)略的提出,帶動了中國智能語音產(chǎn)業(yè)的迅速發(fā)展。從技術上看,大企業(yè)不斷提高語音識別的準確度、優(yōu)化產(chǎn)品性能,使得智能語音在車載信息服務系統(tǒng)、智能家居等領域的應用進一步深化。4G網(wǎng)絡的普及、大數(shù)據(jù)和云計算的發(fā)展,也為智能語音應用提供了技術保障。
向陽也指出,智能語音產(chǎn)業(yè)仍面臨很多瓶頸。從產(chǎn)品看,目前很多人只是把智能語音產(chǎn)品當作“玩具”。因為語音識別的準確度雖然上升了,但仍不穩(wěn)定,尤其是記憶功能尚欠缺。此外,97%的識別率指的是普通話識別,如果加上方言,識別率會更低。從商業(yè)模式看,以微軟的“小冰”為例,仍是純研發(fā)試驗模式,如果單純做產(chǎn)品,用戶可能不會買單。向陽建議,在商業(yè)模式方面,要探索和發(fā)展“入口經(jīng)濟”模式,和第三方產(chǎn)品進行搭載,留住用戶,從而創(chuàng)造經(jīng)濟價值。在產(chǎn)品方面,則要提升性能和用戶體驗度,才能真正從產(chǎn)品走向產(chǎn)業(yè)。