記者日前獲悉,由中關(guān)村科技企業(yè)推出的全球首個(gè)全方位智能人機(jī)交互云平臺(tái)“靈云”,本月起向普通開發(fā)者開放注冊。對普通開發(fā)者來說,看似高深莫測的語音識(shí)別、手寫識(shí)別等技術(shù)能力,今后不僅能像水電一樣按需購買,還能在軟件開發(fā)、調(diào)試階段免費(fèi)享用。
“我兩年前有個(gè)不錯(cuò)的移動(dòng)互聯(lián)網(wǎng)應(yīng)用創(chuàng)意,可是需要用到語音識(shí)別技術(shù),自己又一點(diǎn)也不懂,只能白白放棄了。”技術(shù)愛好者劉晨有些無奈。其實(shí),劉晨如果早點(diǎn)知道并不是所有具備語音識(shí)別功能的APP,都需要由開發(fā)者自己動(dòng)手研發(fā),或許就能創(chuàng)造出一個(gè)熱門應(yīng)用了。
在一款名為“靈云”的云平臺(tái)上,能將平面文字轉(zhuǎn)換成逼真人聲的“語音合成能力”,讓機(jī)器“聽懂”人們說話的“語音識(shí)別能力”,從掃描儀、照相機(jī)捕捉到的照片上“讀”出文字的“光學(xué)字符識(shí)別能力”等,這些能力都可以像超市中的商品一樣買得到。開發(fā)者只需要從平臺(tái)獲得一個(gè)具有相應(yīng)能力的開發(fā)包,載入自己的軟件工程中,就能實(shí)現(xiàn)這些神奇的功能了。
“不同能力每使用一次,消耗1到5個(gè)點(diǎn)數(shù)。”“靈云”平臺(tái)的開發(fā)企業(yè)北京捷通華聲語音技術(shù)有限公司相關(guān)負(fù)責(zé)人于凡所說的“點(diǎn)數(shù)”,是指開發(fā)者某個(gè)應(yīng)用調(diào)用一次識(shí)別能力所需要的虛擬貨幣——“云端使用點(diǎn)數(shù)”。8月開始開放的“靈云”平臺(tái),開發(fā)者注冊后將免費(fèi)獲贈(zèng)數(shù)千點(diǎn)“云端使用點(diǎn)數(shù)”。
2011年,捷通華聲推出了全球第一個(gè)全方位智能人機(jī)交互感知云——“靈云”。與以往開發(fā)者只能通過銷售渠道接觸該平臺(tái)不同,從本月開始,開發(fā)者只要免費(fèi)注冊一個(gè)“靈云”平臺(tái)用戶,就能免費(fèi)使用平臺(tái)上的智能人機(jī)交互資源。
“智能人機(jī)交互”,搭載在“云平臺(tái)”上能有什么好處呢?
“舉個(gè)形象的例子,利用‘云端’能力就好像每個(gè)月根據(jù)需要買水、買電;而傳統(tǒng)的‘終端’實(shí)現(xiàn)方式,就好比一次性買了個(gè)大發(fā)電機(jī)、大水窖在家,好用是好用,但存儲(chǔ)空間、耗費(fèi)資源程度都很大。”于凡說。
其實(shí),讓機(jī)器實(shí)現(xiàn)語音識(shí)別跟教小孩子說話是一個(gè)道理,都需要讓機(jī)器對語音語料進(jìn)行長時(shí)間的訓(xùn)練,讓機(jī)器像小孩子一樣“學(xué)習(xí)”語言,然后再進(jìn)行識(shí)別。這個(gè)學(xué)習(xí)的過程,少則兩三千個(gè)小時(shí),多則上萬個(gè)小時(shí),而學(xué)習(xí)的“范圍”則是以TB級(jí)計(jì)算的原始文本語料。這對于普通的開發(fā)者來說,無疑是一筆難以承擔(dān)的巨額成本。
“類似中國‘Siri’或安卓‘Siri’的計(jì)劃不太適合國內(nèi)創(chuàng)業(yè)公司,因?yàn)橥度氪、風(fēng)險(xiǎn)高、技術(shù)難以實(shí)現(xiàn)。”創(chuàng)新工場董事長兼CEO李開復(fù)評價(jià)。而有了這樣一個(gè)隨時(shí)可按需購買的云平臺(tái),李開復(fù)的擔(dān)心將不再是問題。即使“手無寸鐵”,開發(fā)者也能借力“云端”,發(fā)揮自己的技術(shù)創(chuàng)新能力,做出可以實(shí)現(xiàn)智能人機(jī)交互的產(chǎn)品。