捷通華聲面向智能車載、智能家電、智能家居、機器人等領(lǐng)域?qū)iT開發(fā)的全方位解決方案——靈云種子近期將全面升級,靈云種子將采用靈云遠場語音識別技術(shù)能力,從根本上改變目前市場上因各式問題導致的僅能近距離交互的方式,為智能語音技術(shù)應(yīng)用于智能車載、智能家電、智能家居、機器人等靈云奠定堅實的基礎(chǔ)。
靈云種子自2015年初發(fā)布以來,得到了智能硬件、車載、機器人等多個領(lǐng)域的一致好評,特別是在機器人領(lǐng)域,解決了之前存在的種種人機交互困難的問題,使設(shè)備脫離了機械控制,真正讓機器人實現(xiàn)了“能說會聽、能思考、會判斷”。
很長一段時間以來,科大訊飛、NUANCE等語音技術(shù)公司都在努力開拓智能硬件市場,但智能硬件產(chǎn)品在很多場景下因語音交互體驗不如人意而不能滿足市場的需求,究其原因主要是受限于背景噪音、其他聲音干擾、回聲、混響等多重復雜因素,進而導致的識別距離近、識別率低等明顯痛點,在這些問題沒有解決之前,智能硬件語音交互方面將一直是一個短板。鑒于此,靈云推出遠場語音識別技術(shù),將極大推進語音識別技術(shù)在真實生活場景中的應(yīng)用。
遠場語音識別技術(shù)的核心有兩點,一是語音前端處理:利用麥克風陣列、回聲消除等技術(shù)將目標說話人的聲音增強,并抑制/消除周圍無用的聲音(噪聲+回聲);二是語音識別引擎針對麥克風陣列處理后的數(shù)據(jù)進行專門優(yōu)化,以使遠場識別效果達到最優(yōu)。
靈云種子此次推出的遠場語音識別技術(shù),集成了全新的麥克風陣列方案,并利用麥克風陣列的空域濾波特性——在目標說話人方向形成拾音波束,抑制波束之外的噪聲和反射聲,其降噪和去混響效果均為國內(nèi)領(lǐng)先水平。
可以想象,基于靈云遠場語音識別的遠距離、高識別率支撐,現(xiàn)在用戶在以家庭為單位的活動范圍內(nèi),幾乎可以通過語音輕松操控家里的一切智能硬件設(shè)備,推而廣之,搭載遠場識別的智能硬件產(chǎn)品將無限擴大適用范圍和應(yīng)用場景。目前的方案主要根據(jù)算法不同,可分為適用于電視機、空調(diào)、機器人等的加性麥克風陣列和適用于采訪話筒、錄音筆等的差分麥克風陣列。
靈云種子 智能終端交互一站式解決方案
2015年以來,國內(nèi)各種智能硬件產(chǎn)品在爭論中不斷涌現(xiàn),尤其是蘋果公司apple watch的發(fā)布,幾乎是給原本叫好不叫座的智能硬件市場打了一劑強心針,智能硬件廠商更是如雨后春筍般冒芽而出。盡管智能硬件以及機器人市場被炒得火熱,但怎么定義智能,并真正體現(xiàn)智能依然為產(chǎn)業(yè)界,也是媒體爭論的熱點,傳統(tǒng)人機交互方式帶來的局促感也越來越顯著,甚至成為其“叫好不叫座”的核心因素之一。過去,鮮有一套完整的方案能夠全面滿足各類智能硬件的智能交互需求。
在此背景之下,捷通華聲依托靈云平臺(hcicloud.com),強化靈云全方位人工智能技術(shù)的融合,向企業(yè)級開發(fā)商特別推出了一整套智能終端交互組件—靈云種子,包括靈云語音識別、語音合成、語義理解、聲紋識別、人臉識別、指紋識別等多種人工智能交互能力,并提供簡單易用的開發(fā)接口,供各類智能終端進行集成調(diào)用,實現(xiàn)人與終端設(shè)備多種方式的自由溝通和控制。包括智能語音交互、智能語音導航、智能語音控制、聲紋解鎖、手寫輸入、智能圖像識別、安全身份認證等多種人機交互功能,滿足了包括機器人、智能車載、智能家電、智能家居及可穿戴式設(shè)備等各個行業(yè)的對人工智能技術(shù)的應(yīng)用的大量且多方位的需求。
目前,捷通華聲“靈云種子”已經(jīng)升級到3.0版,新版靈云種子新增云端和本地同時識別,并從結(jié)果中擇優(yōu)的功能,提高了語音識別的準確率和識別速度。優(yōu)化了意圖理解的32個領(lǐng)域?蓮V泛應(yīng)用在以下場景中:
- 語音檢索:支持包括路況導航類、家居菜單智能導航類、周邊服務(wù)類、生活服務(wù)類、娛樂類等多種語音檢索服務(wù);
- 消息提醒:人性化定制推送類別:來電提醒、短信提醒、應(yīng)用提醒,并可將設(shè)置在云端;
- 通訊娛樂:支持短信發(fā)送,電話通訊,多媒體播放,手機操控;
- 健康服務(wù):支持傳感器,提供傳感器數(shù)據(jù)分析,為用戶提供健康圖表,并結(jié)合云端服務(wù)提供定制健康指導等現(xiàn)有及正在研發(fā)的能力;
- 云平臺:基于靈云平臺,提供多設(shè)備數(shù)據(jù)同步,私人信息云存儲,智能推薦;
- 智能支付:結(jié)合智能終端特點,提供更便捷、更多樣的智能支付方式。
- 虛擬現(xiàn)實擴展:將AR技術(shù)與LBS技術(shù)整合,為用戶提供包括周邊景點商圈實景展示,路線提示,為O2O服務(wù)提供優(yōu)秀體驗;
這些方案類似于一個開發(fā)模版,靈云(hcicloud.com)平臺將這些特定領(lǐng)域和場景的智能交互方案經(jīng)過設(shè)計和優(yōu)化后,打造出一體化的全智能人機交互解決方案——“靈云種子”。直接應(yīng)用“靈云種子”配置的技術(shù)服務(wù)和內(nèi)容服務(wù),即可滿足各種智能硬件的智能化需求。