各展所長(zhǎng) 開(kāi)放競(jìng)合
隨著谷歌、微軟、IBM等IT巨頭加快對(duì)智能語(yǔ)音領(lǐng)域的布局,以及Nuance在中國(guó)的本土化不斷加強(qiáng),國(guó)內(nèi)語(yǔ)音企業(yè)將面臨越來(lái)越大的競(jìng)爭(zhēng)壓力。相較于Nuance等國(guó)際巨頭,國(guó)內(nèi)語(yǔ)音企業(yè)在研發(fā)力量、創(chuàng)新能力、集成應(yīng)用、行業(yè)應(yīng)用拓展等方面還有不小差距。國(guó)內(nèi)語(yǔ)音企業(yè)間的合作、并購(gòu)、整合步伐也相對(duì)要緩慢一些。
對(duì)于國(guó)內(nèi)語(yǔ)音企業(yè)的發(fā)展,作為行業(yè)專(zhuān)家的李德升給出了他的見(jiàn)解和建議。他認(rèn)為,在傳統(tǒng)語(yǔ)音技術(shù)廠商中,科大訊飛的實(shí)力有目共睹,而捷通華聲的語(yǔ)音合成在鐵路交通、金融電信等領(lǐng)域也有較高的市場(chǎng)占有率,很多高鐵、公交站等的報(bào)站語(yǔ)音是捷通華聲做的。對(duì)于這類(lèi)廠商,李德升給出的建議是得專(zhuān)注于語(yǔ)音,引入互聯(lián)網(wǎng)思維,真正做大做強(qiáng)。對(duì)于百度、騰訊、搜狗等互聯(lián)網(wǎng)廠商做語(yǔ)音,李德升認(rèn)為他們具有最豐富的互聯(lián)網(wǎng)語(yǔ)音資源,更重要的是他們有技術(shù)實(shí)力、有用戶(hù)、有互聯(lián)網(wǎng)思維,這些廠商最有可能可以和國(guó)外競(jìng)爭(zhēng)者一較高下。而對(duì)于第三類(lèi)語(yǔ)音創(chuàng)業(yè)企業(yè),李德升的建議是盡量采取合作方式,與互聯(lián)網(wǎng)廠商合作,專(zhuān)注于特定行業(yè)領(lǐng)域積累實(shí)力,既不能小富即安,也不能貪高大上,只要積極進(jìn)取,踏實(shí)經(jīng)營(yíng),還是有非常大的成長(zhǎng)空間的。
“其實(shí),以蘋(píng)果為代表的軟硬件一體化廠商做語(yǔ)音是為了賣(mài)硬件產(chǎn)品,互聯(lián)網(wǎng)廠商大多是從幫助用戶(hù)搜索的角度做語(yǔ)音,相對(duì)于創(chuàng)業(yè)型的語(yǔ)音企業(yè),科大訊飛的優(yōu)勢(shì)就在于語(yǔ)音的寬度和厚度積累,優(yōu)勢(shì)就在于多年來(lái)對(duì)語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)音評(píng)測(cè)與語(yǔ)義理解各方面立體的投入和研究,目前擁有全方位立體的語(yǔ)音技術(shù)產(chǎn)品。”江濤說(shuō),在語(yǔ)音推廣方面,科大訊飛堅(jiān)持兩條腿走路:一是堅(jiān)持移動(dòng)互聯(lián)網(wǎng)能力開(kāi)發(fā),一是通信、教育和安全等重點(diǎn)行業(yè)推進(jìn)。逐步拓展移動(dòng)互聯(lián)網(wǎng)能力的三駕馬車(chē)是手機(jī)、汽車(chē)和智能電視。目前科大訊飛手機(jī)語(yǔ)音已經(jīng)有四億的用戶(hù),每天活躍用戶(hù)達(dá)四千多萬(wàn)。在教育領(lǐng)域,科大訊飛的語(yǔ)音合成、語(yǔ)音評(píng)測(cè)在廣東高考英語(yǔ)口語(yǔ)考試,西部中小學(xué)的英語(yǔ)教具和日常教學(xué)中已經(jīng)發(fā)揮很大作用;而在安全領(lǐng)域,公安部第一個(gè)跟企業(yè)合辦的部級(jí)重點(diǎn)實(shí)驗(yàn)室—公安部聲紋實(shí)驗(yàn)室就設(shè)在科大訊飛。
江濤也坦言,相較于百度等互聯(lián)網(wǎng)巨頭做語(yǔ)音,傳統(tǒng)語(yǔ)音技術(shù)廠商確實(shí)存在一些劣勢(shì),“在整個(gè)大的開(kāi)發(fā)平臺(tái)、云存儲(chǔ)、位置服務(wù)和構(gòu)建整個(gè)生態(tài)系統(tǒng)方面,互聯(lián)網(wǎng)公司確實(shí)值得我們學(xué)習(xí)。我們還是要專(zhuān)心做好自己所長(zhǎng),聚焦在語(yǔ)音和語(yǔ)義方面,真正做好開(kāi)發(fā)者服務(wù),基于語(yǔ)音和語(yǔ)義構(gòu)建生態(tài)系統(tǒng),嘗試推廣人機(jī)交互廣告等。”
“互聯(lián)網(wǎng)巨頭要擁有語(yǔ)音這個(gè)技術(shù),不被別人卡住喉嚨,但他們有自己的主業(yè),不會(huì)放太多精力在語(yǔ)音上。”張連毅如此判斷,“語(yǔ)音技術(shù)廠商只要做好自己的技術(shù)和產(chǎn)品,保持開(kāi)放合作就能獲得良好的發(fā)展。”除了夯實(shí)智能語(yǔ)音市場(chǎng),捷通華聲更要做的是實(shí)現(xiàn)包括智能語(yǔ)音、圖像識(shí)別(OCR)、生物特征識(shí)別在內(nèi)的全方位的人機(jī)智能交互。
說(shuō)到與其他廠商的競(jìng)爭(zhēng),云知聲并不擔(dān)心。干凈環(huán)境下朗讀語(yǔ)音的識(shí)別早已不是問(wèn)題,特殊場(chǎng)景應(yīng)用大幅提升,語(yǔ)音市場(chǎng)未來(lái)潛力巨大。黃偉認(rèn)為,語(yǔ)音這個(gè)市場(chǎng)足夠大,找準(zhǔn)各自細(xì)分的目標(biāo)市場(chǎng),只要各自做得好,都能分到自己那杯羹,生存發(fā)展的機(jī)會(huì)很大。云知聲除了做金融等行業(yè)應(yīng)用推廣,主要聚焦在視頻和車(chē)載領(lǐng)域。而對(duì)于全智能交互,云知聲的策略是連橫—聯(lián)合多家創(chuàng)業(yè)公司,包括語(yǔ)義理解技術(shù)公司哦啦、圖像識(shí)別技術(shù)公司亮風(fēng)臺(tái)、人臉識(shí)別技術(shù)公司Face++成立了全智能交互聯(lián)盟,將語(yǔ)音、圖像、人臉交互方案打包,期待不同的交互技術(shù)發(fā)生化學(xué)反應(yīng),用做乘法代替做加法,為用戶(hù)打造最佳的全智能交互體驗(yàn)。除此之外,云知聲仍將專(zhuān)注于云(移動(dòng)應(yīng)用、呼叫中心、在線教育)、端(智能終端包括智能家電、可穿戴設(shè)別、智能車(chē)載等)、芯(智能芯片)領(lǐng)域的智能語(yǔ)音推廣與應(yīng)用。
的確,這是一個(gè)蓬勃向上的時(shí)代,也是一個(gè)不進(jìn)則退的時(shí)代。中國(guó)語(yǔ)音技術(shù)企業(yè)只要抱定“以針破天”的信念,專(zhuān)注堅(jiān)持,踏實(shí)積累,把握機(jī)遇,就能鯤鵬擊浪,展翅怒飛,扶搖直上九萬(wàn)里。加油吧,中國(guó)智能語(yǔ)音。
百度語(yǔ)音SDK功能特點(diǎn)
- 微工作量就可以開(kāi)發(fā)出連接
百度語(yǔ)音服務(wù)的客戶(hù)端應(yīng)用
- 支持Android和iOS平臺(tái)SDK
- 針對(duì)場(chǎng)景深度優(yōu)化
- 針對(duì)領(lǐng)域優(yōu)化,使垂直類(lèi)應(yīng)用
有更好的識(shí)別效果
- 用戶(hù)定制化識(shí)別
- 自動(dòng)端點(diǎn)斷點(diǎn)檢測(cè)和數(shù)據(jù)傳輸,極致優(yōu)化流量消耗
- 豐富可配置的UI組件
- 提供底層API,使用方式更加 靈活強(qiáng)大