該平臺融合智能語音、智能圖像、生物特征識別、智能語義等12項人工智能技術(shù),并面向產(chǎn)業(yè)全面開放。為此,作為中國軟件網(wǎng)策劃的“2018中國AI應(yīng)用、平臺與生態(tài)”系列專訪第二期,我們采訪了捷通華聲總經(jīng)理武衛(wèi)東,跟他聊一聊人智能應(yīng)用和人工智能開放平臺的發(fā)展邏輯,以及捷通華聲的一些實踐經(jīng)驗。
深化應(yīng)用、構(gòu)建平臺,是人工智能廠商的未來
根據(jù)中國軟件網(wǎng)《2018中國人工智能應(yīng)用與生態(tài)研究報告》中調(diào)研數(shù)據(jù)顯示,38%的人認為我國人工智能產(chǎn)業(yè)目前處于應(yīng)用擴展、平臺建設(shè)階段;33%的人認為我國人工智能產(chǎn)業(yè)已經(jīng)進入平臺競爭、生態(tài)建設(shè)階段?梢,大部分人都認為我國正在進行AI平臺和生態(tài)建設(shè)。
值得提出的是,應(yīng)用落地和平臺、生態(tài)建設(shè)是同步并舉,人工智能廠商之間的競爭將在多個維度同時進行。要建成完善的AI平臺和生態(tài),預(yù)計還有5~10年時間。
武衛(wèi)東認為,通過構(gòu)建人工智能開放平臺的方式,深化行業(yè)應(yīng)用、聚集合作伙伴,進而構(gòu)建人工智能產(chǎn)業(yè)生態(tài)是捷通華聲重要的戰(zhàn)略布局。捷通華聲在這方面很早就進行了積極的探索,2011年,捷通華聲的靈云平臺就面向產(chǎn)業(yè)全面開放,并以“云+端”方式,為產(chǎn)業(yè)界提供語音合成(TTS)、語音識別(ASR)、麥克風(fēng)陣列(SMA)、語音喚醒(VW)、手寫識別(HWR)、光學(xué)字符識別(OCR)、人臉識別(AFR)、聲紋識別(VPR)、指紋識別(FPR)、自然語言理解(NLU)、數(shù)據(jù)挖掘(DM)、機器翻譯(MT)等全方位人工智能能力。通過將其積累的人工智能技術(shù)開放出來,捷通華聲積累了眾多的合作伙伴,并服務(wù)大量的行業(yè)客戶。
融合多項智能應(yīng)用,打通整個人工智能產(chǎn)業(yè)鏈
武衛(wèi)東指出,目前人工智能廠商大多提供單一的智能服務(wù),比如語音識別、圖像識別等,多項智能應(yīng)用的融合度不高。但是就市場需求來看,用戶想要的往往是多項智能服務(wù),并且這些不同領(lǐng)域的智能應(yīng)用要很好的融合,形成完善的解決方案。
捷通華聲作為在智能語音領(lǐng)域領(lǐng)先的廠商,其能力不僅局限于語音領(lǐng)域,已經(jīng)擴展到智能圖像、智能語義、生物特征識別等領(lǐng)域。具體來看,捷通華聲提供的智能服務(wù)包括:
智能語音領(lǐng)域,捷通華聲靈云語音識別正確率為97%以上,并能實現(xiàn)21種語言的語音合成服務(wù),以及行業(yè)領(lǐng)先的語義理解能力。另外,捷通華聲還提供獨具特色的聲紋識別應(yīng)用,可以根據(jù)說話人的語音特征,提供聲紋鑒別和聲紋確認,并作為生物特征識別的重要手段。
智能圖像領(lǐng)域,捷通華聲提供的OCR服務(wù),除了支持識別漢語、英語之外,還支持維語、藏語等少數(shù)民族文字的識別。更進一步的,捷通華聲具備手寫識別能力,能將手寫字跡轉(zhuǎn)化成文本,識別準(zhǔn)確率在99.9%以上。此外,捷通華聲還支持人臉識別和指紋識別技術(shù)。
值得提出的是,捷通華聲通過靈云平臺來提供這些智能應(yīng)用,致力于實現(xiàn)不同種類智能服務(wù)的融合,而不是簡單的產(chǎn)品堆砌。在武衛(wèi)東看來,單項技術(shù)的局限性較大,未來必然是多項AI技術(shù)的高度融合。為此,捷通華聲突出全方位人工智能的能力建設(shè),并以靈云平臺為載體,向開發(fā)者、合作伙伴開放出來,共同賦能整個人工智能生態(tài)的發(fā)展。
融合生物特征識別,提供個性化智能服務(wù)
構(gòu)建人工智能平臺,不是單純的將各項AI能力放上去就可以,要發(fā)揮作用必然要理順內(nèi)部的業(yè)務(wù)邏輯。在與武總的交流中,給我啟發(fā)比較大的是捷通華聲基于生物特征識別打通智能服務(wù)鏈條的構(gòu)想和實踐。
在捷通華聲看來,人工智能應(yīng)用的一個重要價值,就是對不同用戶提供高度符合其需求的相關(guān)服務(wù)。在以前,針對特定個體提供定制化服務(wù)只在很有限的范圍內(nèi)實現(xiàn),比如對VIP客戶的服務(wù)。現(xiàn)在,由于數(shù)據(jù)的積累和智能化技術(shù)的發(fā)展,基于數(shù)據(jù)分析的用戶畫像和定制化服務(wù),無論從技術(shù)難度還是經(jīng)濟效益上來說,都具備了實現(xiàn)的可能。而要實現(xiàn)對不同個體的定制化服務(wù),關(guān)鍵的第一步就是對實現(xiàn)特定個體的識別。在互聯(lián)網(wǎng)時代,人們大多通過各類賬戶來實現(xiàn)用戶識別;在智能時代,基于生物特征的用戶識別將成為常態(tài),比較典型的就是人臉識別和指紋識別。另外,捷通華聲還提供獨具特色的聲紋識別服務(wù),可以根據(jù)一個人聲音特點來進行身份識別和驗證。
通過人臉、聲紋、指紋等生物特征識別技術(shù),加上數(shù)據(jù)分析和用戶畫像,就可以打通整個智能服務(wù)鏈條,給用戶帶來實時、智能的服務(wù)體驗。為此,他描述了這樣一個場景:一個銀行用戶進入銀行,通過人臉識別、聲紋識別技術(shù),系統(tǒng)可以根據(jù)對用戶面部和聲音的識別知道他的身份,再通過對系統(tǒng)內(nèi)該用戶記錄和用戶畫像的分析,推測出該用戶的需求,并提供不同的服務(wù)。比如根據(jù)系統(tǒng)分析,如果一個用戶屬于風(fēng)險厭惡型的,在推薦理財產(chǎn)品時就會選取低風(fēng)險產(chǎn)品;如果分析出該用戶是激進型的,則推薦高風(fēng)險、高收益的理財產(chǎn)品。這樣,可以大大提升用戶體驗,提升用戶粘性。這樣一套系統(tǒng)充分體現(xiàn)了人工智能相對于人的優(yōu)越性,在上述場景中,銀行大堂經(jīng)理是不可能對進入銀行的每個用戶都能全面了解的。通過人工智能與大數(shù)據(jù)技術(shù),以及多項AI能力的融合,構(gòu)建的這套系統(tǒng)能實現(xiàn)基于身份認證的個性化智能服務(wù),這也是靈云平臺的優(yōu)勢所在。
攜手合作伙伴,共鑄智能生態(tài)
作為成立于2000年并一直全面發(fā)展人工智能云服務(wù)的高新技術(shù)企業(yè),捷通華聲不僅提供智能語音、智能圖像、生物特征識別、智能語義等全方位人工智能技術(shù)研究與應(yīng)用,也與眾多伙伴一起,推展更豐富的應(yīng)用領(lǐng)域,搭建互利共贏得智能生態(tài)。
基于靈云平臺,捷通華聲致力于用AI技術(shù)促進產(chǎn)品產(chǎn)業(yè)升級,鞏固合作伙伴行業(yè)地位,幫助合作伙伴落地AI業(yè)務(wù)場景,共同構(gòu)建AI全鏈條的行業(yè)生態(tài)。為了最大化支持合作伙伴,捷通華聲可提供公有云、私有云服務(wù)及綜合智能解決方案,并針對不同產(chǎn)品靈活變換合作模式。此外還提供全套的技術(shù)培訓(xùn)支持,包括靈云AI產(chǎn)品課程培訓(xùn)、業(yè)務(wù)分享沙龍、在線視頻技術(shù)學(xué)習(xí)等,并在聯(lián)合推廣營銷方面給予合作伙伴大量的支持。
在人工智能的各個領(lǐng)域,平臺化、生態(tài)化趨勢日益明顯,其平臺和生態(tài)建設(shè)路徑一般是:通過AI技術(shù)賦能各個行業(yè),找到一些適合AI應(yīng)用的領(lǐng)域快速商業(yè)化和規(guī);;加快應(yīng)用領(lǐng)域拓展、行業(yè)深耕和客戶資源的積累;搭建人工智能平臺,實現(xiàn)生態(tài)化發(fā)展。總體來看,捷通華聲也基本遵循了這一發(fā)展路徑,在發(fā)展出眾多AI能力之后,構(gòu)建人工智能平臺,攜手合作伙伴共建智能生態(tài),未來必將取得更大的成績。