CTI論壇(ctiforum)6月9日消息(記者 于鑫):2013年炒得最熱的不是房地產(chǎn),而是智能人機(jī)交互技術(shù)(HCI)在IT圈的極速擴(kuò)張。國(guó)內(nèi)的互聯(lián)網(wǎng)大佬代表BAT在搜索、電商、移動(dòng)等各個(gè)領(lǐng)域搶灘攻地,在智能人機(jī)交互(HCI)領(lǐng)域炒得更是火爆,從百度首先戰(zhàn)略投資國(guó)內(nèi)第一大智能語(yǔ)音技術(shù)開發(fā)商捷通華聲開始,就已打開了智能語(yǔ)音五彩的市場(chǎng);然而隨著2013年沸沸騰騰的語(yǔ)音熱潮逐漸退去,2014年圖像識(shí)別熱潮又開始幕天席地而來,其中以O(shè)CR技術(shù)尤為矚目。
OCR(光學(xué)字符識(shí)別)技術(shù)隸屬圖像識(shí)別技術(shù)的一支,也是HCI技術(shù)領(lǐng)域最早實(shí)現(xiàn)商業(yè)化的技術(shù),早期多用于辦公文檔錄入與金融、保險(xiǎn)等大型企業(yè)的票證識(shí)別系統(tǒng),然而近年來隨著智能移動(dòng)端的迅速發(fā)展,OCR技術(shù)已在潛移默化中從To B端延伸至To C端,被廣泛地應(yīng)用于各個(gè)領(lǐng)域、各項(xiàng)軟硬件中。
放眼國(guó)外,近日來有iphone6 ios 8系統(tǒng)透露的用戶信用卡掃描功能以及微軟SkyDrive欲推出的OCR搜索的消息。
而國(guó)內(nèi)BAT三巨頭也馬不停地相繼推出OCR相關(guān)服務(wù)和產(chǎn)品,例如百度的涂書筆記、騰訊微信智能開放平臺(tái)開放圖像識(shí)別端口、阿里提出的深化手機(jī)應(yīng)用概念。
這是否預(yù)示著2014年將是OCR技術(shù)重新迸發(fā)活力的一年?
語(yǔ)音熱潮漸消,OCR后浪迭起
眾所周知,2013年是APP全面攻陷國(guó)民智能移動(dòng)端的一年,其中尤以智能語(yǔ)音交互技術(shù)炒得轟轟烈烈,在蘋果siri引爆語(yǔ)音識(shí)別后,國(guó)內(nèi)在這一領(lǐng)域的技術(shù)先驅(qū)企業(yè)捷通華聲、訊飛等更是奮力直追,打造出更符合漢語(yǔ)言習(xí)慣的智能語(yǔ)音交互技術(shù);而在語(yǔ)音合成(TTS)技術(shù)方面,一直作為國(guó)內(nèi)TTS技術(shù)領(lǐng)導(dǎo)者的捷通華聲更是在2013年因其靈云平臺(tái)(hcicloud.com)推出十幾種國(guó)際語(yǔ)言合成技術(shù),滿足全球90%地區(qū)的語(yǔ)音合成服務(wù)而獨(dú)領(lǐng)風(fēng)騷。
然而信息技術(shù)瞬息萬(wàn)變,在智能語(yǔ)音剛被推上一個(gè)新的關(guān)注和應(yīng)用高度的時(shí)候,OCR等智能圖像技術(shù)又順勢(shì)創(chuàng)新應(yīng)用于各領(lǐng)域,引起業(yè)內(nèi)的廣泛關(guān)注。
在國(guó)內(nèi),OCR技術(shù)商品化最早成熟于上世紀(jì)90年代,對(duì)于行業(yè)內(nèi)人士和金融通信類企業(yè)來講并不陌生,那時(shí)多應(yīng)用于文本自動(dòng)錄入與證件和表格掃描,以便減少人工錄入成本。
然而,現(xiàn)今隨著云計(jì)算、大數(shù)據(jù)時(shí)代的到來,各行業(yè)各領(lǐng)域的單位和開發(fā)者對(duì)OCR技術(shù)的需求也越來越多樣化,大至銀行海關(guān)證照,小到淘寶店主收支票據(jù),而智能移動(dòng)端的迅速發(fā)展正給OCR便捷化、普遍化提供了可能和新的發(fā)展機(jī)遇。
OCR再次以其獨(dú)特的錄入方式而成為互聯(lián)網(wǎng)新的入口,引發(fā)了產(chǎn)業(yè)界與各大IT大佬的 廣泛關(guān)注,不斷的產(chǎn)品與技術(shù)創(chuàng)新比拼,使OCR技術(shù)在2014年重又走上了IT舞臺(tái)的中心,在HCI技術(shù)領(lǐng)域,繼智能語(yǔ)音之后,一場(chǎng)智能圖像領(lǐng)導(dǎo)者的爭(zhēng)斗戰(zhàn)再次打響。
捷通華聲“云+端”OCR,滿足用戶多樣化需求
捷通華聲OCR首席技術(shù)官李健表示:“在國(guó)內(nèi),OCR技術(shù)已發(fā)展了數(shù)十年,而我們對(duì)該項(xiàng)技術(shù)的研究也已積累了數(shù)十年的調(diào)研數(shù)據(jù)和實(shí)踐經(jīng)驗(yàn),無(wú)論是識(shí)別率、識(shí)別速度、用戶界面的友好性,還是產(chǎn)品的穩(wěn)定性、易用性及可行性等,都足以與國(guó)內(nèi)外IT巨頭抗衡。
自2011年,捷通華聲推出國(guó)內(nèi)外第一個(gè)全方位HCI技術(shù)云服務(wù)平臺(tái)靈云后,靈云OCR系統(tǒng)發(fā)揮靈云“云+端”的優(yōu)勢(shì),可滿足用戶多樣化定制需求,為OCR技術(shù)的應(yīng)用提供了比以往任何時(shí)候都寬廣的發(fā)展空間。傳統(tǒng)的OCR軟件只是通過單一的終端設(shè)備,無(wú)法聯(lián)網(wǎng),應(yīng)用、操作較單一;而靈云OCR系統(tǒng)則可通過靈云服務(wù)全方位拓展應(yīng)用領(lǐng)域。如:每年我國(guó)有眾多數(shù)字圖書館建設(shè)中的大量紙張數(shù)據(jù)信息,所有銀行、稅務(wù)局、保險(xiǎn)公司的大量票據(jù),公安邊防海關(guān)等部門的各類證照卡數(shù)據(jù)信息等等,都需要輸入到電腦里并做分析存儲(chǔ),幾乎可覆蓋到國(guó)家及各部委的所有重點(diǎn)行業(yè)領(lǐng)域。與此同時(shí),新興的商業(yè)及個(gè)人應(yīng)用與服務(wù)市場(chǎng)更是一個(gè)巨大的市場(chǎng)空白,捷通華聲靈云OCR在這一即將成熟的領(lǐng)域已搶占先機(jī)。”