在人工智能領域,有歷史的公司并不多,捷通華聲算一家。
1989年,畢業(yè)于清華大學環(huán)境工程系的張連毅,到紫光集團的前身——清華大學科技開發(fā)總公司任職,負責推廣清華的OCR(光學字符識別)軟件。1992年,擔負著將清華OCR技術商業(yè)化的使命,張連毅創(chuàng)建了北京清華文通技術有限公司。
1992年底,就在公司發(fā)展勢頭正旺的時候,張連毅選擇了出國深造,后來經(jīng)歷了創(chuàng)業(yè)、打工、讀書種種波折,6年后,他決定回國,重新創(chuàng)業(yè)。
1998年8月,張連毅在朋友的幫助下,在中關村留學人員創(chuàng)業(yè)基地的兩間小房子里,創(chuàng)建了捷通軟件,還做熟悉的“老本行”——漢字處理和錄入。
同年,捷通推出了“錄易漢語智能輸入輸出系統(tǒng)”,成為國內第一家將語音合成、語音識別、手寫識別技術成功地集成在OA辦公軟件系統(tǒng)的公司。
然而,當時的OCR市場已經(jīng)有了眾多競爭對手——依托中科院自動化所的漢王科技、同門公司紫光集團和北京文通,還有摩托羅拉。
由于OCR技術幾乎是和掃描儀綁定在一起,因此定位軟件開發(fā)的捷通逐漸也賣起了掃描儀。不過,張連毅很快意識到,硬件銷售風險很大,利潤越做越薄,而且捷通一直缺乏核心技術,于是2000年底,在硬件銷售額迅速躥升時,張連毅選擇了轉型,他聯(lián)合著名中文語音專家呂士楠教授,一起成立了北京捷通華聲語音技術有限公司,要做語音合成。
當時,科大訊飛剛成立一年。
三次轉型,從語音合成到全方位人工智能
從2001年開始,捷通華聲在國內語音市場占有率一直保持在20%左右,超過了IBM、摩托羅拉等國際巨頭,僅次于科大訊飛;服務客戶包括國航、華北電網(wǎng)、山東鐵通、農行、建行、中國銀行等企業(yè),合作伙伴包括IBM、英特爾、海爾集團,以及Nuance前身Scansoft、法國語音技術公司Acapela,產品和技術銷往美國、新加坡、日本等地。
然而,一沒借助資本、二沒擁抱政府高校的捷通華聲,很難與資源和技術實力雄厚的科大訊飛抗衡。光靠語音合成,很難養(yǎng)活企業(yè)。于是從2002年開始,在兼顧語音合成、語音識別、OCR、手寫識別的同時,捷通又做起了SP(服務提供商),也就是以前功能機上的手機游戲,一做就是9年。
2011年,隨著蘋果推出Siri語音助手,語音交互得到了一定程度的市場預熱。張連毅意識到語音技術的機會要來了,于是再一次決定轉型,砍掉游戲業(yè)務,全力進軍人工智能。
按照張連毅的理念,只有一項技術對于企業(yè)來說十分危險,一旦被競爭對手趕超,企業(yè)將很難生存。而人工智能包含一整套技術,相互之間有很強的關聯(lián)性,而且在很多場景下都需要同時使用,因此,不同于其他專注單一技術的AI公司,捷通華聲要做全方位的人工智能。
2011年,隨著第一筆風險資金的注入,捷通華聲推出了全球首個全方位人工智能開放平臺——靈云平臺(AIcloud.com),將智能語音交互、圖像識別、生物特征識別、語義理解等技術整合起來,提供一體化的AI技術云服務及各種解決方案。
2013年,清華大學產業(yè)基金入資捷通華聲。憑借清華在人工智能領域雄厚的研究力量,捷通華聲先后與北京清華工業(yè)研究院、清華海峽研究院共同創(chuàng)建靈云人工智能研究中心,致力于促進清華大學科技成果轉化,提升靈云核心競爭力。
十項技術,六大領域,三種方案
如今,靈云平臺提供的人工智能技術涵蓋語音識別、語音合成、聲紋識別、語義理解、OCR、手寫識別、人臉識別、指紋識別、機器翻譯、數(shù)據(jù)挖掘十大方向。
表1:捷通華聲主要業(yè)務產品,來源:公開轉讓說明書
服務客戶覆蓋通信、金融、互聯(lián)網(wǎng)、能源、交通、IT、醫(yī)療、教育、政府、汽車等眾多行業(yè),包括國家電網(wǎng)、中石油、中石化等大型國企,華為、中興等信息通信供應商,建行、中信、華夏、太平洋保險等金融機構,網(wǎng)易、京東、愛奇藝等互聯(lián)網(wǎng)公司,以及寶馬、奔馳、比亞迪等國內外車企。
表2:捷通華聲服務領域及代表客戶,來源:捷通華聲官網(wǎng)
產品生態(tài)體系包括靈云公有云服務、全智能能力平臺、以及智能解決方案,其中,公有云服務的運營采用標準能力免費開放以及能力方案定制服務兩種,而全智能能力平臺是以私有云方式部署的能力平臺級產品,智能解決方案則是以全智能能力平臺為基礎,開發(fā)針對用戶各類需求的綜合解決方案。總體來看,即公有云、私有云以及解決方案三種形式。
營收及利潤增長較快,整體毛利率有望提升
從財務表現(xiàn)來看,捷通華聲是高科技企業(yè)中少有的連續(xù)幾年盈利的企業(yè)之一。
表3捷通華聲2013-2016年上半年主要財務指標
根據(jù)捷通華聲股轉書及半年報數(shù)據(jù),2014年、2015年、及2016年上半年,捷通華聲分別實現(xiàn)營收3820萬、5329萬、3368萬元,凈利潤503萬、1068萬、391萬元。
表4捷通華聲2014年到2016年上半年營收及凈利潤增長率
從營收和凈利潤增長率來看,近兩年內兩項財務指標增速明顯加快。據(jù)張連毅透露,2016年全年,捷通總營收將達7000-8000萬元,未來營收增長將保持30%以上。
表5捷通華聲2014年到2016年上半年營收結構及毛利率
注:2014年和2015年1-10月,“其他業(yè)務”為無線增值業(yè)務,2016年上半年,“其他業(yè)務”為智能移動及技術維護業(yè)務。
從營收結構及毛利率來看,2014-2016年,捷通華聲軟件業(yè)務營收占比一直保持在50%以上,并在2016年上半年有小幅提升;無線增值業(yè)務雖然在2011年已經(jīng)不再投入,但是由于長尾效應,仍在產生收入,但下降幅度明顯;硬件業(yè)務在2016年還將保持在2000萬元以內,在總營收中的占比將明顯下降,有望帶動整體毛利水平的提升。
技術融合大勢所趨,全能冠軍之路挑戰(zhàn)重重
捷通營收持續(xù)增長,在一定程度上反映了近兩年人工智能產業(yè)應用的火熱,而捷通選擇的技術融合之路,也正在成為這一領域的發(fā)展趨勢。
首先,從供給端看,不僅科大訊飛、BAT等大公司陸續(xù)推出了包含語音、圖像、語義等在內的綜合性人工智能平臺,多家軟硬件AI技術創(chuàng)業(yè)公司也致力于整合多項AI技術提供給行業(yè)客戶,比如做機器人操作系統(tǒng)的圖靈機器人,做機器人軟硬件方案的ROOBO智能管家等。
其次,從需求端看,包括金融、安防、電信等率先應用的行業(yè)對AI技術的需求也是全方位的,比如對于身份的認證、識別,更是需要語音、聲紋、人臉、手寫識別等多項技術聯(lián)合使用,多重驗證。
在這樣的背景下,深耕行業(yè)多年、且背靠清華技術資源的捷通優(yōu)勢明顯。不過,在幾項新興技術領域,捷通也面臨著技術研發(fā)、產品打磨和推廣,以及閉環(huán)構建等一系列挑戰(zhàn)。同時,在技術融合優(yōu)勢發(fā)揮出來之前,捷通仍然不可避免地要和各個領域的玩家進行正面PK。
語音合成、語音識別等領域,有科大訊飛、云知聲、思必馳等通用和垂直型技術提供商;OCR和手寫識別領域,有漢王科技、紫光集團等老牌企業(yè);智能客服領域,有小i機器人以及Udesk等幾家逐漸轉向智能客服的云客服公司;而人臉識別領域,又有曠視、商湯等實力較強的新興企業(yè)。
不過,正如張連毅所說,這些公司可能要做百米冠軍、跳遠冠軍、跳高冠軍,而捷通要做的是十項全能冠軍。
由于產品線眾多,且市場需求增大,多年來一直有意控制團隊規(guī)模和成本的張連毅,最近也感受到了壓力,正在緊鑼密鼓地招兵買馬,以壯大團隊力量。捷通能否成為十項全能冠軍,在AI領域大展拳腳,按照張連毅的預測,接下來兩三年內將見分曉。
圖:捷通華聲董事長張連毅
近期,愛分析對捷通華聲董事長張連毅進行了調研訪談,現(xiàn)將部分內容摘錄如下。
Q:捷通的各項技術和業(yè)務發(fā)展有側重嗎?
A:有。捷通在技術上都有涉及,但是在商業(yè)化應用上是有步驟的。
第一主攻方向是智能語音交互,包括語音合成和語音識別。語音合成做了十多年,非常成熟,而語音識別真正開始應用是在2013-2014年,現(xiàn)在已經(jīng)走過了這一階段。
第二主攻階段是自然語言理解,包括智能客服。這一階段跟小i競爭比較激烈。
現(xiàn)階段是第三主攻——圖像識別,包括OCR和手寫識別,F(xiàn)在技術實現(xiàn)了突破,正在加緊轉化成商業(yè)化產品。
明年開始向第四個方向主攻——生物特征識別,包括人臉識別和聲紋識別等。
Q:OCR技術現(xiàn)在有哪些難點?捷通取得了哪些突破?
A:OCR技術目前的難點在于模糊、壓線、重疊、有背景色等情況下的識別。比如駕駛證上面的機打字很多時候會打到橫線上,在識別的時候就會存在混淆,一些有背景色和圖案的名片,在識別文字的時候需要先對背景進行去色等。
現(xiàn)在全球范圍內做得最好的OCR公司是俄羅斯的ABBYY,我們現(xiàn)在實驗室的內部測試已經(jīng)超越了ABBYY,接下來會推出相應的商業(yè)化產品。
Q:OCR技術一定要和掃描儀結合嗎?
A:早期掃描儀和OCR一定要結合,不過現(xiàn)在OCR技術逐漸開始融入手機和高拍儀,但是大部分行業(yè)還是用的掃描儀。
Q:硬件業(yè)務除了掃描儀還有哪些?
A:硬件主要就是掃描儀,還有麥克風陣列,以及一些輔助設備,比如服務器等。
Q:如何看待當前的人臉識別技術和市場?
A:人臉識別的技術要求是跟行業(yè)應用掛鉤的,比如公司考勤98%以上就足夠了,但是金融安防領域就要求準確率達到100%。所以我認為,人工智能在金融領域的應用,單一技術有難以承受的風險,技術無法保證100%正確,只有通過多項技術融合,多重驗證,才能保證萬無一失。
現(xiàn)在生物識別的準確率相比模式識別并不是很高,只有虹膜識別是最高的,所以捷通會把聲紋、人臉、指紋、證照識別一起用上,F(xiàn)在,我們的人臉識別已經(jīng)在中國人民銀行、北京市委新辦公樓投入使用,聲紋識別也用在了民生銀行和廈門國際銀行。明年我們會主攻人臉識別,之后還會推出全套的生物特征識別技術。
Q:200人的團隊規(guī)模并不大,捷通如何實現(xiàn)多項技術的研發(fā)和產品商業(yè)化?
A:這是一個Know-How的問題,我一般都不正面回答。先別管我們怎么做到的,只用回到市場,看我們有沒有做到就可以了。首先,語音合成、語音識別產業(yè)領域有捷通,明年華為手機手寫識別都是捷通的,OCR技術已達到國內最高水平,智能客服捷通捷報頻傳,語音分析和數(shù)據(jù)挖掘捷通一舉拿下了三個大單子,共計1000多萬,人臉和聲紋識別,上面提到過,中國人民銀行、民生銀行等都是我們的客戶,已開始商業(yè)化。
靈云科技,源自清華。捷通的很多技術都是基于清華二三十年的研究,捷通是站在巨人的肩膀上,與巨人同行的。所以相信清華,相信人工智能有它的道,這個道不是每家企業(yè)都能理解的。捷通的產品和團隊現(xiàn)在確實還不足,但是我們已經(jīng)取得了很好的商業(yè)化成果。接下來,我們還會繼續(xù)用市場說話。
Q:捷通的技術提供形式是什么樣的?
A:捷通正在從之前單獨的授權,向公有云、私有云解決方案轉變。比如智能客服,如果客戶不想搭服務器,我們可以提供公有云服務,如果客戶要求數(shù)據(jù)保密,我們可以提供私有云服務,也就是在能力基礎上提供方案服務。
Q:所有的服務都需要定制嗎?
A:對,不管是公有云還是私有云方案,都需要提前針對客戶的業(yè)務進行訓練。比如客服領域,很多航空公司和金融機構都是我們的客戶,這兩類客戶具體業(yè)務差別很大,都需要有針對性地做定制,哪怕是同一行業(yè)的不同客戶,由于業(yè)務具體內容的差別,也需要進行定制。
當然工具類的AI技術具有一定的通用性,但是對于服務類和解決方案類來說,定制不可避免,而且針對一些專業(yè)性較強的領域,也需要提前做大量訓練。
Q:軟件銷售毛利高,為什么還要做硬件?
A:軟件在中國還是不值錢的,純軟件銷售毛利確實高,但是價格要不高。
Q:目前投入主要在什么地方?
A:主要包括人力投入、設備投入、數(shù)據(jù)投入、科研投入等。我們200人的團隊,一年投入6000萬左右,和清華合作研發(fā)也需要投入。
Q:和清華有哪些合作?
A:清華有四大研究院:北京清華工業(yè)研究院、深圳清華研究院、海峽清華研究院、以及長三角清華研究院。北京清華工業(yè)研究院是我們的投資方,我們深圳的辦公室就在深圳清華研究院,另外我們和海峽清華研究院合作成立了靈云人工智能中心。
我們從原來的OCR、手寫識別、語音合成,到現(xiàn)在包括語音識別、人臉識別、語義理解、機器翻譯等十項技術,離不開清華的支持與助力。
Q:對捷通的估值預期?
A:捷通不會包裝,用一些人的話說,叫“缺乏互聯(lián)網(wǎng)思維”。而且一直以來我對公司的成本和規(guī)模把控比較嚴格,所以人工智能各個領域的很多公司估值都比捷通高。
而且我們的公告數(shù)據(jù)讓很多人產生了誤會。2013年清華進來的時候,說先占5%,兩年后還按當時的價格再占5%,加上華軟也要進來,所以就有了今年年初我們公告里面的4億估值,其實那是2013年的價格。
現(xiàn)在我們投前估值15億,目前正在和一些投資人談,希望引入一些資金進來。
Q:希望找什么樣的投資方?
A:我希望找能理解人工智能的投資人,甚至能夠允許公司虧損幾年。因為AI技術投入非常大,而且總是起起伏伏。如果能夠理解AI,確信投它是沒有錯的,就會比較放心。人工智能不是其他行業(yè)能夠想象的,它現(xiàn)階段確實不夠完美,但是產業(yè)機會已經(jīng)來了。如果有志同道合的投資方,我們歡迎,當然我們的原則是不對賭,不承諾不切實際的要求。
Q:對捷通的營收增長預期?
A:今年營收大概7000-8000萬,我希望捷通接下來能夠保持30%的增長。
其實從捷通的財務數(shù)據(jù)都能看出來,過去捷通的收益主要是兩部分:軟硬件和SP業(yè)務。SP業(yè)務由于長尾效應一直存在,它在捷通發(fā)展歷史上一直起著重要作用。而做人工智能,從技術研發(fā)到產品的包裝和推廣,都不是一蹴而就的,它需要時間。
所以我們希望從今年開始算元年,因為今年是營收中沒有SP業(yè)務的第一年,我們又回到了公司較為良好的時候,算是歷史最高水平。接下來,產業(yè)需求還會持續(xù)增長,我們也會繼續(xù)提高軟件業(yè)務比重。