近日,捷通華聲靈云AI研發(fā)團(tuán)隊推出四川話語音識別技術(shù),語音識別正確率實現(xiàn)行業(yè)領(lǐng)先。捷通華聲成都分公司負(fù)責(zé)人表示,靈云四川話語音識別技術(shù)將服務(wù)于車載、家居智能語音交互,司法審訊、政企會議智能語音轉(zhuǎn)寫等場景,為巴蜀地區(qū)大眾的生活和工作帶來便捷。
為了能更好、更精準(zhǔn)地識別四川話,捷通華聲采集了大量真實四川話錄音數(shù)據(jù),并對其進(jìn)行語料標(biāo)注和數(shù)據(jù)訓(xùn)練,為四川話定制了專用語音識別模型。
在語音識別核心算法上,捷通華聲對建模單元粗粒度、模型訓(xùn)練方法、解碼幀率進(jìn)行創(chuàng)新優(yōu)化,有效提升了語音識別引擎的執(zhí)行效率和對口音、語速的適配能力,大幅提升了四川話語音識別的正確率。
四川話語音識別讓大眾生活更便捷
智能語音交互技術(shù)已進(jìn)入我們的生活,成為更便捷的人機交互方式。伴隨著此次四川話語音識別的推出,捷通華聲推出了系列四川話版智能語音產(chǎn)品。
靈云智能語音助理四川話版,讓川蜀大眾可以用四川話實現(xiàn)對智能電視、智能家居、智能機器人、智能可穿戴設(shè)備的語音控制;
靈云車載輸入法四川話版、靈云手機輸入法,可以讓四川地區(qū)車主、手機用戶用說四川話的方式快速進(jìn)行文字輸入;
此外,捷通華聲四川話語音識別技術(shù)即將上線靈云平臺(AIcloud.com),讓開發(fā)者能快速開發(fā)出支持四川話識別的智能應(yīng)用。
四川話語音識別讓政企司法辦公更高效
在辦公方面,靈云智能語音識別技術(shù)已服務(wù)于政企會議、司法審訊等場景,用機器轉(zhuǎn)寫代替人工實現(xiàn)更高效的會議記錄。
在公檢法司法審訊場景,應(yīng)用普通話、四川話語音識別技術(shù),靈云智會系統(tǒng)將在識別審訊人普通話的同時,將被訊問人說的四川話進(jìn)行識別,快速生成訊問記錄,加快辦案效率。
同樣,在政企會議場景,靈云智會系統(tǒng)可以分角色地將四川話進(jìn)行識別,快速生成會議記錄;在醫(yī)療場景,可通過定制版的四川話醫(yī)療智能語音輸入法,讓醫(yī)生以說話的方式快速書寫電子病歷。
除了上面描述的16k語音識別技術(shù),捷通華聲不久還將推出電話信道的8k四川話語音識別技術(shù),以支持callcenter用的電話智能客服、智能外呼機器人、智能語音分析等方案產(chǎn)品。
捷通華聲作為國內(nèi)最早從事智能語音技術(shù)研發(fā)的企業(yè)之一,目前,靈云語音識別技術(shù)已支持中文普通話、四川話、英語、粵語、維吾爾語、哈薩克語、藏語安多、藏語康巴、朝鮮語、蒙文、廣東陽江話等多種語言,并針對金融、電信、公檢法、會議、醫(yī)療等領(lǐng)域訓(xùn)練了專用ASR模型,為行業(yè)客戶提供識別率更高的語音識別能力。
捷通華聲將通過成都分公司,攜手產(chǎn)業(yè)伙伴,為四川地區(qū)客戶提供更優(yōu)質(zhì)的本地化支持,讓靈云四川話語音識別技術(shù)服務(wù)更多的巴蜀大眾。