靈云開放平臺(tái)憑借捷通華聲十幾年的功底,語音合成、語音識(shí)別技術(shù)無論在“云”還是“端”,用戶均可以輕松調(diào)用。靈云語音合成播放輕松自然,尤其值得指出的是,靈云可讓合作伙伴選擇適合于自身應(yīng)用的多種聲音,并提供中文普通話、粵語(廣東話)、維吾爾語、英語、德語、法語、俄羅斯、西班牙、日語、韓語等在內(nèi)十幾種語言的語音合成能力;而語音識(shí)別因其對硬件資源的特殊要求,實(shí)現(xiàn)“端”識(shí)別對技術(shù)提出更高的要求,靈云離線式語音“端”識(shí)別以識(shí)別率高、定制簡單等特點(diǎn),與靈云語音合成一起為用戶提供幾乎完美的智能語音“云+端”服務(wù)。
張連毅講到:“靈云率先推出‘云 + 端’服務(wù)模式,是捷通華聲的一種理念,一切為用戶著想,即‘舍棄’云端服務(wù)可以獲取所謂寶貴數(shù)據(jù)資源與用戶資源等利益,滿足用戶甚至在沒有網(wǎng)絡(luò)的環(huán)境下,仍然能夠方便使用智能語音技術(shù)能力,也讓數(shù)以億計(jì)的大眾不必為‘高昂’的流量費(fèi)買單,輕松享受智能語音等HCI技術(shù)能力的服務(wù)。”
一項(xiàng)好的智能人機(jī)交互技術(shù)簡單來說,就是讓機(jī)器更好地“讀懂”用戶的意圖。隨著語音識(shí)別率地提升,在確保識(shí)別率的前提下,對于噪音的處理就顯得尤為重要。在噪音環(huán)境中,有一項(xiàng)技術(shù)不可或缺,它就是語義理解。張連毅稱:“靈云語義理解可對輸入語音的語義進(jìn)行分析,保證識(shí)別率的同時(shí),也確保語音合成播報(bào)使用者需要獲得的準(zhǔn)確信息。”
據(jù)了解,靈云“云 + 端”自推出以來,迅速為產(chǎn)業(yè)所接納,不僅提供智能語音技術(shù)于導(dǎo)航領(lǐng)域,百度語音助手、搜狗語音助手、聚熵360、南京米果、蟲洞語音助手等系列語音助手軟件;天行輸入法、百度輸入法、觸寶輸入法,也包括“漢字英雄”、漢字書寫大賽更是將智能語音、智能圖像“云 + 端”及其合作模式,超乎想象地完美應(yīng)用。
隨著智能語音技術(shù)引發(fā)關(guān)注,智能語音“互聯(lián)網(wǎng)入口說、關(guān)卡壁壘說、大數(shù)據(jù)說、資本說”等各種說法風(fēng)靡IT產(chǎn)業(yè),甚至最近又出現(xiàn)了“血統(tǒng)說、家族說”。面對眾多學(xué)說,張連毅則一笑了之,只淡然說了一句:“說一千,道一萬,語音識(shí)別、語音合成其實(shí)就是‘工具’,一個(gè)人與機(jī)器交流的工具。”即無論什么時(shí)候,智能語音交互最主要的核心功能還是一個(gè)聲音錄入與輸出的工具。張連毅介紹說,智能語音技術(shù)差不多每十年就“熱鬧”一場,他相信:當(dāng)智能語音更加實(shí)用,也充分滿足了大眾的好奇之后,很快會(huì)象過去一樣回歸到自然與純樸——在這個(gè)領(lǐng)域中,有心的,會(huì)安心提高語音識(shí)別準(zhǔn)確率、語音合成自然度,關(guān)注用戶使用與體驗(yàn);炒作的,一定耐不住這種技術(shù)螺旋式進(jìn)步的“寂寞”,受不了“只有更好、沒有最好”的刺激,也會(huì)悄然退場。
合作共贏,促進(jìn)中國語音產(chǎn)業(yè)發(fā)展
談到將要舉辦的“2013中國語音產(chǎn)業(yè)年會(huì)”,張連毅并不隱瞞對語音產(chǎn)業(yè)聯(lián)盟過去的失望,及對未來已擁有的很高期望。去年,在工信部支持下成立的中國語音產(chǎn)業(yè)聯(lián)盟,卻只有一家專業(yè)語音企業(yè),包括捷通華聲、中科信利、得意音通等專業(yè)語音公司,及百度、騰訊等從事語音技術(shù)應(yīng)用的大型互聯(lián)網(wǎng)公司,甚至清華大學(xué)實(shí)力強(qiáng)悍的語音研究機(jī)構(gòu)均被“莫名其妙的擋在外面”。張連毅說,這次年會(huì),很高興看到工信部相關(guān)領(lǐng)導(dǎo)與相關(guān)部門的高度重視,并深入到國內(nèi)所有語音企業(yè)、研究機(jī)構(gòu)中調(diào)研,充分聽取各方意見,促成了一個(gè)真正集“產(chǎn)、學(xué)、研”一體化,幾乎容納所有語音技術(shù)領(lǐng)域相關(guān)企業(yè)與研究單位參加的語音產(chǎn)業(yè)聯(lián)盟的誕生。
張連毅認(rèn)為,語音等HCI技術(shù)產(chǎn)業(yè)擁有巨大的發(fā)展空間,要跳出“狹小”的空間,要擁有與發(fā)展大產(chǎn)業(yè)相匹配的博大心胸,更不要“搞山頭”,“拉派系”,市場競爭不同于學(xué)術(shù)討論,服務(wù)市場與廣大用戶才是實(shí)力的最好體現(xiàn)。自“863”計(jì)劃開始,國家已在語音技術(shù)領(lǐng)域投入了巨額的科研基金,也可謂碩果累累,如今幾乎所有的語音企業(yè)也都多少享受到這些成果,此乃國家遠(yuǎn)見之舉,產(chǎn)業(yè)發(fā)展之幸!而得到國家直接支持最多的企業(yè)或者機(jī)構(gòu),也應(yīng)想到,伴隨智能語音產(chǎn)業(yè)的發(fā)展,支持社會(huì)產(chǎn)業(yè)發(fā)展,回饋社會(huì),回饋大眾是義不容辭的責(zé)任與義務(wù)。
談到捷通華聲未來發(fā)展,張連毅表示:“捷通華聲將致力發(fā)展靈云開放平臺(tái),靈云不會(huì)發(fā)展單一技術(shù)能力,將在發(fā)揮語音識(shí)別、語音合成等多項(xiàng)HCI技術(shù)優(yōu)勢的基礎(chǔ)上,不斷與學(xué)術(shù)界、產(chǎn)業(yè)界合作,推出更多的HCI技術(shù)能力,讓人機(jī)交互像人與人溝通一樣的簡單自然,促進(jìn)合作共贏成為HCI產(chǎn)業(yè)融入中國IT產(chǎn)業(yè)的主旋律。”
今年,捷通華聲靈云已設(shè)立1000萬發(fā)展基金,半年來資金的使用,包括對國內(nèi)各種HCI技術(shù)各種學(xué)術(shù)會(huì)議的支持已取得非常好的效果。如果哪家科研院所、或者企業(yè)有新的HCI技術(shù),靈云都可以為其提供平臺(tái)支持、資金與市場支持,靈云的目標(biāo)是融合所有成熟的HCI技術(shù),并向社會(huì)全面開放,堅(jiān)定支持中國實(shí)現(xiàn)從“中國制造”向“中國創(chuàng)造”的歷史性轉(zhuǎn)變。張連毅最后強(qiáng)調(diào)說:“相信未來發(fā)展,智能語音等HCI技術(shù)依然會(huì)呈現(xiàn)螺旋式進(jìn)步趨勢,無論智能語音、還是智能圖像,抑或生物識(shí)別。沒有最好,只有更好;只有合作,才會(huì)更好!”
關(guān)于張連毅:北京捷通華聲語音技術(shù)有限公司董事長,清華企業(yè)家協(xié)會(huì)(TEEC)成員。1989年獲得清華大學(xué)環(huán)境工程系學(xué)士學(xué)位。1990年,與清華大學(xué)吳佑壽院士、丁曉清教授合作,推進(jìn)“863”計(jì)劃成果漢字印刷體識(shí)別系統(tǒng)(OCR)的商品化進(jìn)程,1992年,受當(dāng)時(shí)國家科委、清華大學(xué)委托,創(chuàng)辦清華文通公司,專注發(fā)展OCR等圖像識(shí)別技術(shù)應(yīng)用。1992年底至1998年6月赴美學(xué)習(xí)、工作。1998年8月歸國,與清華大學(xué)電子系陳明博士創(chuàng)建北京捷通軟件技術(shù)有限公司,全方位發(fā)展HCI技術(shù)應(yīng)用。2000年與中國科學(xué)院聲學(xué)所呂士楠、北京大學(xué)顧小鳳兩位教授共同創(chuàng)建北京捷通華聲語音技術(shù)有限公司。
聲明:CTI論壇(CTiforum)版權(quán)作品,未經(jīng)CTiforum書面授權(quán),嚴(yán)禁轉(zhuǎn)載,違者將被追究法律責(zé)任。