近幾年來(lái),移動(dòng)互聯(lián)網(wǎng)蓬勃發(fā)展,基于互聯(lián)網(wǎng)海量數(shù)據(jù)的深度神經(jīng)網(wǎng)絡(luò)技術(shù)有力推進(jìn),智能家電、汽車(chē)電子、可穿戴設(shè)備等領(lǐng)域加速應(yīng)用,汽車(chē)、醫(yī)療、智能家居、教育等行業(yè)應(yīng)用不斷拓展,智能語(yǔ)音作為新的信息入口,開(kāi)始引領(lǐng)產(chǎn)業(yè)重大變革。
這一兩年來(lái),我國(guó)智能語(yǔ)音市場(chǎng)也是風(fēng)起云涌:2012年8月中國(guó)移動(dòng)以13.6億元戰(zhàn)略投資科大訊飛,科大訊飛受二級(jí)市場(chǎng)機(jī)構(gòu)投資者追捧市值超過(guò)200億元;云知聲創(chuàng)立僅一年就先后獲得兩輪投資,其中一次融資金額高達(dá)1億元;2013年5月,捷通華聲宣布來(lái)自百度、清華大學(xué)戰(zhàn)略投資;2013年8月,百度正式宣布向開(kāi)發(fā)者開(kāi)放語(yǔ)音生態(tài)系統(tǒng),包括底層的語(yǔ)音識(shí)別技術(shù)應(yīng)用程序開(kāi)發(fā)接口(API)、百度語(yǔ)音助手軟件開(kāi)發(fā)工具包(SDK);同樣在這個(gè)月騰訊在微信5.0中增加語(yǔ)音輸入功能,一出來(lái)便風(fēng)靡大眾,微信APP已經(jīng)成為消費(fèi)者每天必刷的強(qiáng)大APP之一;直到最近,2014年4月12日,云知聲組織創(chuàng)業(yè)公司牽頭成立“全智能交互聯(lián)盟”;2014年4月29日,科大訊飛的訊飛輸入法繼支持粵語(yǔ)、四川話(huà)、河南話(huà)等方言之后宣布支持東北話(huà)語(yǔ)音輸入;5月20日晚,錘子科技首款智能手機(jī)Smartisan T1發(fā)布,借科大訊飛智能語(yǔ)音技術(shù)實(shí)現(xiàn)語(yǔ)音搜索、語(yǔ)音輸入等特色功能……整個(gè)產(chǎn)業(yè)一片欣欣向榮。
“智能語(yǔ)音是人機(jī)智能交互的手段之一,而人機(jī)智能交互是目前中國(guó)技術(shù)企業(yè)有可能趕超國(guó)際的為數(shù)不多的產(chǎn)業(yè)機(jī)遇之一。產(chǎn)業(yè)變革是以技術(shù)為先導(dǎo)的。在PC/互聯(lián)網(wǎng)時(shí)代,我國(guó)技術(shù)企業(yè)在計(jì)算機(jī)技術(shù)尤其是操作系統(tǒng)等方面,因?yàn)槠鸩酵恚s超微軟、谷歌等國(guó)際技術(shù)公司比較難,但在智能交互這個(gè)技術(shù)領(lǐng)域,相對(duì)而言,目前中西方起步差不多,如果我們能把握好現(xiàn)在的機(jī)會(huì),好好練內(nèi)功,發(fā)展我們自己的包括智能語(yǔ)音在內(nèi)的交互技術(shù),也許在這方面我們可以真正和國(guó)際公司一較高下,真正從中國(guó)制造走向中國(guó)創(chuàng)造。”北京捷通華聲語(yǔ)音技術(shù)有點(diǎn)公司(簡(jiǎn)稱(chēng)捷通華聲)董事長(zhǎng)張連毅這樣告訴記者。
與張連毅持相同觀點(diǎn)的還有科大訊飛信息科技股份有限公司(簡(jiǎn)稱(chēng)科大訊飛)副總裁江濤和北京云知聲信息技術(shù)有限公司(簡(jiǎn)稱(chēng)云知聲)CEO黃偉。在他們看來(lái),智能語(yǔ)音是難得的一次產(chǎn)業(yè)良機(jī),錯(cuò)過(guò)語(yǔ)音,中國(guó)技術(shù)企業(yè)很難再有機(jī)會(huì)趕超國(guó)際了。
磨一根針 破一片天
“做語(yǔ)音是需要慢慢熬的。”這句話(huà)記者不止聽(tīng)一個(gè)被采訪人說(shuō)過(guò)。
1989年從清華大學(xué)畢業(yè)任職紫光推進(jìn)OCR(圖像掃描識(shí)別),中間赴美,2000年與中國(guó)科學(xué)院聲學(xué)所研究員呂士楠共同創(chuàng)辦捷通華聲的張連毅稱(chēng)自己是語(yǔ)音乃至整個(gè)智能交互行業(yè)的老兵。在他看來(lái),從“入口說(shuō)”、“門(mén)檻說(shuō)”到“血統(tǒng)說(shuō)”再到“技術(shù)說(shuō)”,這兩年來(lái)的語(yǔ)音熱其實(shí)更多是一種炒作,而這種炒作對(duì)行業(yè)本身未必有多大好處。“我只認(rèn)可"技術(shù)說(shuō)"。因?yàn)檎Z(yǔ)音只是交互的方式之一,智能語(yǔ)音就是一門(mén)技術(shù),它與應(yīng)用結(jié)合,這項(xiàng)技術(shù)就能創(chuàng)造出巨大價(jià)值。而這門(mén)技術(shù)的特點(diǎn)是厚積薄發(fā),需要慢慢積累,所以這就決定智能語(yǔ)音產(chǎn)業(yè)是要用一根針刺破天的專(zhuān)業(yè)領(lǐng)域,而不是用一個(gè)鐵錘砸出一片聲勢(shì)的產(chǎn)業(yè),必須專(zhuān)注、專(zhuān)業(yè),精耕細(xì)作,深耕久釀。”
而所謂的積累,在云知聲CEO黃偉看來(lái),就是算法、數(shù)據(jù)和團(tuán)隊(duì)經(jīng)驗(yàn)的積累。他告訴記者,作為創(chuàng)業(yè)型公司,“云知聲的優(yōu)勢(shì)不在于數(shù)據(jù)積累,而在于算法。從云知聲成立第一天起,我們就用了比對(duì)手少一個(gè)數(shù)量級(jí)的數(shù)據(jù)來(lái)訓(xùn)練算法模型,最終達(dá)到甚至超越對(duì)手產(chǎn)品性能,這個(gè)過(guò)程我們也積累了豐富而寶貴的團(tuán)隊(duì)經(jīng)驗(yàn)。而現(xiàn)在開(kāi)放的語(yǔ)音云平臺(tái)已經(jīng)讓我們有了很多用戶(hù)數(shù)據(jù),我們的數(shù)據(jù)短板已經(jīng)得到了彌補(bǔ)。”