人機(jī)交互技術(shù)(HCI技術(shù))最早可追溯到上世紀(jì)80年代,個(gè)人電腦問世后,我們最初通過鍵盤、鼠標(biāo)與計(jì)算機(jī)進(jìn)行交互。進(jìn)入新世紀(jì)后,世界全面進(jìn)入了互聯(lián)網(wǎng)與移動(dòng)互聯(lián)網(wǎng)時(shí)代,手機(jī)也逐漸成為代替PC的智能終端,人機(jī)交互技術(shù)隨之迅速發(fā)展到觸控階段。隨著智能設(shè)備不斷創(chuàng)新與發(fā)展,承載著云計(jì)算、移動(dòng)互聯(lián)網(wǎng)產(chǎn)業(yè)變革,全方位、多角度、的智能人機(jī)交互技術(shù)--HCI技術(shù)成為新時(shí)代的主旋律,掀開了移動(dòng)互聯(lián)網(wǎng)時(shí)代的新篇章。
靈云平臺(tái) 開啟HCI全新體驗(yàn)
2011年12月08日,首臺(tái)全方位的智能人機(jī)交互(HCI)技術(shù)開放平臺(tái)— 靈云(www.hcicloud.com)誕生。靈云是一種可以通過識(shí)別語音、手寫(字符更好)、拍照(圖像更好)、手勢(shì),及腦電波等智能手段來操作,并結(jié)合手機(jī)、計(jì)算機(jī)等數(shù)字設(shè)備的網(wǎng)絡(luò)云服務(wù)平臺(tái)。目前,靈云以“云+端”的方式,為用戶提供語音合成、語音識(shí)別、手寫識(shí)別、光學(xué)字符識(shí)別、自然語言理解等智能人機(jī)交互技術(shù)服務(wù),其目標(biāo)就是力求讓人機(jī)交互與人與人溝通一樣的簡(jiǎn)單自然。今年11月28日,靈云開放平臺(tái)推出了多語種語音合成(簡(jiǎn)稱TTS)技術(shù),支持11種語言進(jìn)行操作,并覆蓋了全球90%以上的國(guó)家和地區(qū)。
負(fù)責(zé)研發(fā)靈云平臺(tái)的北京捷通華聲語音技術(shù)有限公司董事長(zhǎng)張連毅先生說:“靈云平臺(tái)自問世以來,運(yùn)營(yíng)良好。這些年捷通華聲的經(jīng)營(yíng)之道,也正如自己的母校,清華大學(xué)的校訓(xùn)所說---自強(qiáng)不惜,厚德載物。我們用在高調(diào)宣傳的精力不多,而把大部分精力都用在技術(shù)研發(fā)上,只要能拿出優(yōu)質(zhì)的產(chǎn)品,就必有成績(jī),在語音合成的服務(wù)市場(chǎng),可以說,捷通華聲已占據(jù)半壁江山。”
北京捷通華聲語音技術(shù)有限公司董事長(zhǎng)張連毅
靈云平臺(tái)結(jié)合云計(jì)算技術(shù),更高效地為用戶提供便利的服務(wù)。在將來,靈云將攜手海內(nèi)外各個(gè)領(lǐng)域的用戶,共同為全球用戶提供服務(wù)。
十三年服務(wù)十三億國(guó)人
如今,語音技術(shù)已經(jīng)滲入到各行各業(yè)的人機(jī)交互應(yīng)用中,捷通華聲提供語音服務(wù)已有13年之久,領(lǐng)域涉及到鐵路運(yùn)輸、金融、導(dǎo)航、互聯(lián)網(wǎng)、手機(jī)、教育、旅游等眾多行業(yè)。張連毅說,捷通華聲服務(wù)13億人民13年之久,你能想象到需要用到語音技術(shù)的地方,幾乎都會(huì)用到捷通的產(chǎn)品。金融行業(yè),幾乎所有國(guó)內(nèi)銀行都在使用捷通華聲語音播報(bào)功能。全國(guó)高鐵沿線語音播報(bào)服務(wù)大部分也都依靠捷通的技術(shù)支持。我們的合作方式從之前單一提供技術(shù)授權(quán)轉(zhuǎn)變?yōu)樘峁┤娼鉀Q方案,并一直致力于不斷研發(fā)更加全面更加智能的人機(jī)交互技術(shù)。
語音服務(wù)最重要的是實(shí)現(xiàn)輕松交互,使人和機(jī)器之間達(dá)到雙向交流,這種交流不僅限于語音,它的發(fā)展更趨向于全方位智能化。以車載導(dǎo)航為例,早期語音技術(shù)僅僅是合成技術(shù),滿足最基本的語音播報(bào)功能。后來,為了方便駕駛和安全出行,我們期望語音完全代替手指點(diǎn)按方式,通過純語音交互的方式完成人在車內(nèi)的各項(xiàng)需求,這一需求便要求人機(jī)交互的智能性大幅提高。
HCI探索發(fā)展期 沒有最好只有更好
據(jù)中國(guó)智能語音產(chǎn)業(yè)聯(lián)盟發(fā)布的《2013中國(guó)智能語音產(chǎn)業(yè)發(fā)展白皮書》稱,智能語音已進(jìn)入快速應(yīng)用階段。去年,中國(guó)智能語音產(chǎn)業(yè)規(guī)模約為8.6億元,帶動(dòng)相關(guān)產(chǎn)業(yè)產(chǎn)值100億元,預(yù)計(jì)到2017年,將帶動(dòng)相關(guān)產(chǎn)業(yè)規(guī)模增長(zhǎng)1000億元,占全球相關(guān)產(chǎn)業(yè)規(guī)模的比重將由去年的5.6%增至17.1%。在巨大的產(chǎn)業(yè)浪潮推動(dòng)下,HCI技術(shù)又能達(dá)到怎樣的水平呢?張連毅說,現(xiàn)在HCI技術(shù)還在探索發(fā)展期,離真正的理想狀態(tài)還有很大的差距。語音識(shí)別對(duì)于噪音,口音等問題處理的還不夠好,而且交互方式也比較局限,還做不到即時(shí)免喚醒的交互,技術(shù)研發(fā)正在以螺旋式進(jìn)步,在HCI技術(shù)領(lǐng)域,我們沒法說誰最好,因?yàn)榧夹g(shù)更新很快,只有不斷超越,才能實(shí)現(xiàn)更全面的智能交互。但是,我們相信,通過不斷的技術(shù)更新,捷通將會(huì)帶領(lǐng)用戶進(jìn)入全新的感知時(shí)代。