捷通華聲OCR核心引擎是針對特定語言的識別軟件模塊,該軟件模塊是整個(gè)軟件的核心模塊。核心模塊接收其他模塊的設(shè)置,并根據(jù)設(shè)置內(nèi)容對文字圖片數(shù)據(jù)進(jìn)行識別,并將識別結(jié)果列表返回給調(diào)用模塊。
捷通華聲OCR圖像識別技術(shù)具有以下特點(diǎn):
- 支持多國文字識別:支持中文簡繁體、純英文識別,識別率達(dá)到99%以上。
- 支持多種識別方式:支持掃描識別和拍照識別。
- 支持多圖像格式:支持TIFF、BMP、PNG、GIF、JPEG格式圖像的讀取,支持黑白、灰度、彩色圖像的處理;
- 支持自動(dòng)版面分析:能自動(dòng)分析出橫排文本、豎排文本、表格和圖像等區(qū)域,并對文本和表格區(qū)域的文字進(jìn)行識別。針對特殊應(yīng)用(例如名片識別)有專門優(yōu)化的版面分析算法;
- 支持手動(dòng)版本分析:支持對用戶指定區(qū)域的文字圖像進(jìn)行識別;
- 傾斜校正功能:可以對圖像由于掃描引起的傾斜進(jìn)行自動(dòng)校正;
- 畸變校正功能:可以對由于非統(tǒng)一照度和近距拍攝造成的灰度畸變和幾何畸變進(jìn)行自動(dòng)校正;
- 識別字體多樣:支持多語種、多字體、多字號識別;
- 多種字符集輸出:支持GB2312、BIG5、GBK、Unicode、UTF-8等內(nèi)碼的輸出;
- 可獲取識別結(jié)果詳細(xì)信息:能夠獲取識別文字在原文中的信息,包含文字在圖像中的坐標(biāo)、字體、字號、可信度和候選字!