記者日前獲悉,由中關村科技企業(yè)推出的全球首個全方位智能人機交互云平臺“靈云”,本月起向普通開發(fā)者開放注冊。對普通開發(fā)者來說,看似高深莫測的語音識別、手寫識別等技術能力,今后不僅能像水電一樣按需購買,還能在軟件開發(fā)、調試階段免費享用。
“我兩年前有個不錯的移動互聯(lián)網(wǎng)應用創(chuàng)意,可是需要用到語音識別技術,自己又一點也不懂,只能白白放棄了。”技術愛好者劉晨有些無奈。其實,劉晨如果早點知道并不是所有具備語音識別功能的APP,都需要由開發(fā)者自己動手研發(fā),或許就能創(chuàng)造出一個熱門應用了。
在一款名為“靈云”的云平臺上,能將平面文字轉換成逼真人聲的“語音合成能力”,讓機器“聽懂”人們說話的“語音識別能力”,從掃描儀、照相機捕捉到的照片上“讀”出文字的“光學字符識別能力”等,這些能力都可以像超市中的商品一樣買得到。開發(fā)者只需要從平臺獲得一個具有相應能力的開發(fā)包,載入自己的軟件工程中,就能實現(xiàn)這些神奇的功能了。
“不同能力每使用一次,消耗1到5個點數(shù)。”“靈云”平臺的開發(fā)企業(yè)北京捷通華聲語音技術有限公司相關負責人于凡所說的“點數(shù)”,是指開發(fā)者某個應用調用一次識別能力所需要的虛擬貨幣——“云端使用點數(shù)”。8月開始開放的“靈云”平臺,開發(fā)者注冊后將免費獲贈數(shù)千點“云端使用點數(shù)”。
2011年,捷通華聲推出了全球第一個全方位智能人機交互感知云——“靈云”。與以往開發(fā)者只能通過銷售渠道接觸該平臺不同,從本月開始,開發(fā)者只要免費注冊一個“靈云”平臺用戶,就能免費使用平臺上的智能人機交互資源。
“智能人機交互”,搭載在“云平臺”上能有什么好處呢?
“舉個形象的例子,利用‘云端’能力就好像每個月根據(jù)需要買水、買電;而傳統(tǒng)的‘終端’實現(xiàn)方式,就好比一次性買了個大發(fā)電機、大水窖在家,好用是好用,但存儲空間、耗費資源程度都很大。”于凡說。
其實,讓機器實現(xiàn)語音識別跟教小孩子說話是一個道理,都需要讓機器對語音語料進行長時間的訓練,讓機器像小孩子一樣“學習”語言,然后再進行識別。這個學習的過程,少則兩三千個小時,多則上萬個小時,而學習的“范圍”則是以TB級計算的原始文本語料。這對于普通的開發(fā)者來說,無疑是一筆難以承擔的巨額成本。
“類似中國‘Siri’或安卓‘Siri’的計劃不太適合國內創(chuàng)業(yè)公司,因為投入大、風險高、技術難以實現(xiàn)。”創(chuàng)新工場董事長兼CEO李開復評價。而有了這樣一個隨時可按需購買的云平臺,李開復的擔心將不再是問題。即使“手無寸鐵”,開發(fā)者也能借力“云端”,發(fā)揮自己的技術創(chuàng)新能力,做出可以實現(xiàn)智能人機交互的產品。