隨著移動互聯(lián)網(wǎng)、智能終端、云計算的飛速發(fā)展,智能人機(jī)交互(英文:Human-Computer Interaction,以下簡稱“HCI”)技術(shù)也迎來了大爆發(fā)的時代。HCI技術(shù),是指人與計算機(jī)之間使用某種對話語言,以一定的交互方式,為完成確定任務(wù)的人與計算機(jī)之間的信息交換過程。簡單地說就是讓機(jī)器能聽會說,能寫會識,甚至可以感知人們的想法并為之服務(wù)的過程。
在中關(guān)村有著這樣一個人,他用了六年的時間去思索,并與HCI技術(shù)結(jié)下了不解的情緣;用13年的時間堅持做了一件事,把HCI技術(shù)做出“國際水準(zhǔn)”;在很多人眼中他已經(jīng)功成名就,而在他眼中,他的事業(yè)才剛剛起步……他就是北京捷通華聲語音技術(shù)有限公司(以下簡稱“捷通華聲”)董事長張連毅。
環(huán)保需要經(jīng)濟(jì)支撐
當(dāng)前,語音合成、語音識別和手寫識別、OCR已經(jīng)成為成熟的智能人機(jī)交互核心技術(shù),正在悄悄地影響和改變著人們的生活。其中,語音合成技術(shù)可以讓各種設(shè)備“開口講話”,把各種文本信息以語音的方式播報;語音識別技術(shù)可以讓各種設(shè)備“聽懂”我們的話;手寫識別、OCR技術(shù)可以幫助人們從各種設(shè)備繁瑣的按鍵操作中解脫出來,輕松輸入文字。
而在張連毅看來,隨著移動互聯(lián)網(wǎng)、智能終端、云計算、大數(shù)據(jù)等產(chǎn)業(yè)的飛速發(fā)展,智能人機(jī)交互技術(shù)也迎來了大爆發(fā)的時代。他認(rèn)為,“智能人機(jī)交互技術(shù)是各大技術(shù)產(chǎn)業(yè)變革的畫龍點(diǎn)睛之作,也是我國由‘中國制造’向‘中國創(chuàng)造’轉(zhuǎn)型的巨大機(jī)遇,中國在智能人機(jī)交互技術(shù)領(lǐng)域的發(fā)展絕不輸于外國企業(yè)”。
回到20多年前,這樣的豪言對于一個剛從高中走出來的孩子來說,簡直不敢想象。那時,他的夢想只是想讓祖國的天更藍(lán)、水更綠。在填報高考志愿的時候,張連毅的專業(yè)選擇只有一個——環(huán)境工程。
1989年,張連毅在清華大學(xué)環(huán)境工程系畢業(yè)。“我一直都有著一個夢想,走遍祖國,任何一條河流都是清澈的,任何一片天空都是蔚藍(lán)的。”張連毅告訴北京商報記者,“環(huán)境問題,不是一個單獨(dú)的事情,涉及很多的方面,而經(jīng)濟(jì)無疑會成為其中重要的基礎(chǔ)。”就這樣,張連毅畢業(yè)后選擇了一條不同的道路,進(jìn)入清華紫光從事經(jīng)濟(jì)類的工作。
1992年,一次偶然的機(jī)會,他與清華大學(xué)教授吳佑壽、丁曉清合作,推進(jìn)漢字印刷體識別系統(tǒng)商品化進(jìn)程,這是他與HCI技術(shù)的初識。
六年HCI技術(shù)情緣
1992年底,張連毅登上了去美國的飛機(jī)。“想做更多的事情,但是能力并不足以支撐自己的理想,我需要出去學(xué)習(xí)、開闊視野。” 張連毅告訴北京商報記者,“我登機(jī)的時候,就在考慮什么時間可以回來。因?yàn),我一直認(rèn)為國內(nèi)才是實(shí)現(xiàn)自己夢想最好的地方。”就這樣,他開始了長達(dá)六年的留美生活,為自己充電成為他生活中惟一的主題。
1998年,張連毅帶著夢想回到國內(nèi),他要創(chuàng)辦一家屬于自己的企業(yè),而且這家企業(yè)一定要有自己的技術(shù)與產(chǎn)品!帶著這個想法,他與清華大學(xué)博士陳明一拍即合,將目光瞄向了漢字錄入行業(yè)。1998年8月,捷通軟件在中關(guān)村成立,這也讓他在六年后再次和念念不忘的HCI技術(shù)再續(xù)前緣。
1998年當(dāng)年,一款名為“錄易”的漢字錄入產(chǎn)品正式進(jìn)入市場,它將手寫、掃描、拼音、五筆等多種漢字輸入法融聚一身。在北京商報記者眼中,這是一款在當(dāng)時擁有著超前理念的顛覆性產(chǎn)品,它的出現(xiàn)讓漢字輸入法不再局限于某一種方式,可以滿足各種人的各種需求。張連毅表示,“在我看來各種各樣的漢字輸入法其實(shí)就是一個工具,實(shí)現(xiàn)漢字錄入的一個工具。我們把各種方式整合,讓工具用起來更方便,這樣可以滿足更多人的需求”。
“為什么選擇中關(guān)村?中關(guān)村的優(yōu)勢在哪里?在我看來中關(guān)村有著得天獨(dú)厚的優(yōu)勢,清華、北大、中科院這些科研院所里面可全都是人才!”有過大學(xué)校企工作經(jīng)驗(yàn)的張連毅對大學(xué)的優(yōu)質(zhì)科研資源念念不忘,2000年他先后聘請我國知名語音專家呂士楠教授和北京大學(xué)顧小鳳教授出任首席科學(xué)家,共同創(chuàng)建北京捷通華聲語音技術(shù)有限公司,借助兩位科學(xué)家在相關(guān)領(lǐng)域深厚的科研經(jīng)驗(yàn),捷通華聲開始逐漸成為國內(nèi)中文信息技術(shù)領(lǐng)域不可忽視的力量。
全球首個HCI感知云
從“中國制造”到“中國創(chuàng)造”的改變,需要中國企業(yè)技術(shù)的不斷創(chuàng)新。HCI技術(shù)在中國有著超過30年的發(fā)展歷史,前20年大多都是在實(shí)驗(yàn)室研究階段,近十年來才開始廣泛應(yīng)用到人們生活的各個領(lǐng)域,但其推動產(chǎn)業(yè)發(fā)展的巨大能量遠(yuǎn)未顯現(xiàn)。
“一個全新時代的大幕才剛剛拉開,云計算、移動互聯(lián)網(wǎng)、大數(shù)據(jù)、HCI這些技術(shù)蓬勃發(fā)展,新的商業(yè)模式也初現(xiàn)曙光。當(dāng)我們把所有用戶的行為和需求匯集到一塊去的時候,整個社會都將被技術(shù)的發(fā)展所重構(gòu)。”張連毅引用百度大數(shù)據(jù)首席架構(gòu)師林仕鼎的話來展開他的觀點(diǎn)與想法。在他眼中,云計算勢如破竹地撞擊著傳統(tǒng)產(chǎn)業(yè),移動互聯(lián)網(wǎng)改變著人們生活工作的方式,大數(shù)據(jù)讓整個世界變得更加有規(guī)律可循,而HCI技術(shù)雖然沒那么轟轟烈烈,但它卻悄然地在人們的生活、工作中助力著這幾大板塊的應(yīng)用。
在北京商報記者眼中,“十年磨一劍”正是張連毅和捷通華聲的真實(shí)寫照。張連毅認(rèn)為,產(chǎn)業(yè)化、服務(wù)化是推動HCI技術(shù)發(fā)展的動力,HCI技術(shù)的不斷創(chuàng)新應(yīng)用則是推動整個信息產(chǎn)業(yè)不斷發(fā)展的動力引擎之一。捷通華聲憑借十多年來在智能人機(jī)交互技術(shù)、移動互聯(lián)網(wǎng)領(lǐng)域的雄厚積累,于2011年推出了全球第一個全方位智能人機(jī)交互感知云——靈云平臺(www.hcicloud.com),為從“中國制造”向“中國創(chuàng)造”的全面升級提供了一個強(qiáng)大的“發(fā)動機(jī)”引擎。
當(dāng)盲人無法看到手機(jī)短信,卻可以聽取這些信息;當(dāng)老年人看不清手機(jī)按鍵,卻可以通過說來對手機(jī)下達(dá)“命令”;當(dāng)司機(jī)在駕駛過程中為保證安全,通過收聽語音播報獲得叫車信息……云計算、大數(shù)據(jù)、移動互聯(lián)網(wǎng)、HCI技術(shù)的快速發(fā)展、彼此交融,正悄然地改變著人們的生活方式。
構(gòu)建HCI技術(shù)生態(tài)圈
數(shù)據(jù)顯示,捷通華聲所擁有的自主知識產(chǎn)權(quán)中文語音合成、語音識別技術(shù)在國內(nèi)語音交互技術(shù)市場占有率達(dá)到50%,手寫識別、掃描識別技術(shù)達(dá)到35%的市場占有率,成為國內(nèi)第一家倡導(dǎo)并實(shí)現(xiàn)同時提供語音合成、語音識別、手寫識別、OCR、機(jī)器翻譯等全系列HCI核心技術(shù)的企業(yè)。
雖然,捷通華聲在智能人機(jī)交互技術(shù)領(lǐng)域已經(jīng)成為領(lǐng)先廠商,但捷通華聲在該領(lǐng)域的耕耘遠(yuǎn)不止于此。張連毅介紹說,“雖然智能人機(jī)交互技術(shù)已經(jīng)取得了非常廣泛的應(yīng)用,但其技術(shù)本身還存在一些不完善的地方,例如語音識別率還不能做到百分之百,語音合成雖然已經(jīng)可以流利地學(xué)習(xí)人講話,但講話的語氣及感情色彩相比真人還有一定差距。因此,業(yè)界還需要去不斷學(xué)習(xí)、了解、應(yīng)用、完善好這些智能人機(jī)交互技術(shù),這需要整個產(chǎn)業(yè)來推動其發(fā)展”。
日前,捷通華聲的靈云開發(fā)者社區(qū)正式向整個社會全方位開放各項(xiàng)能力,所有的企業(yè)和個人開發(fā)者都可以免費(fèi)加入到靈云開發(fā)者社區(qū)。在靈云開發(fā)者社區(qū),企業(yè)和個人開發(fā)者均可直接下載語音合成(TTS)、語音識別(ASR)、手寫識別(HWR)、光學(xué)字符識別(OCR)等多項(xiàng)HCI核心技術(shù)。與此同時,捷通華聲還將加強(qiáng)技術(shù)指導(dǎo),幫助開發(fā)者把不同的智能人機(jī)交互技術(shù)應(yīng)用到產(chǎn)品上,與企業(yè)和個人開發(fā)者共同了解、學(xué)習(xí)、切磋、完善各種智能人機(jī)交互技術(shù)。
張連毅表示,“HCI技術(shù)是一項(xiàng)可能永遠(yuǎn)也無法達(dá)到完美、完善的技術(shù),不斷的創(chuàng)新會讓技術(shù)無限接近盡善盡美,但可能永遠(yuǎn)不會達(dá)到終點(diǎn),這就是HCI技術(shù)的魅力所在,也是其擁有巨大市場發(fā)展空間的魅力所在。你可以做到在一個階段領(lǐng)先,能夠?qū)κ袌銎鸬綇?qiáng)勢的領(lǐng)導(dǎo)地位,但可能也會瞬間被甩到后面。我喜歡這樣的挑戰(zhàn),還有更多的路需要去探索與發(fā)現(xiàn)”。