為了方便更多媒體記者快速整理訪談、會(huì)議新聞稿件,捷通華聲在靈云語(yǔ)音云上線最新ASR引擎的基礎(chǔ)上,推出黨政會(huì)議專業(yè)領(lǐng)域語(yǔ)言模型,面對(duì)兩會(huì)發(fā)言、政府報(bào)告、黨團(tuán)會(huì)議等相關(guān)錄音實(shí)現(xiàn)了超高的轉(zhuǎn)寫識(shí)別準(zhǔn)確率,獲得媒體記者一致好評(píng)。
黨政專業(yè)領(lǐng)域模型優(yōu)化 成就超高識(shí)別準(zhǔn)確率
“我的天!這語(yǔ)音云也忒牛了!本打算熬夜整理兩會(huì)錄音的,沒想到等了幾分鐘,錄音內(nèi)容就變成了文字,太省事了!”一位剛剛結(jié)束兩會(huì)工作的記者用了靈云樂識(shí)轉(zhuǎn)寫錄音后驚嘆道,“而且這準(zhǔn)確率太高了,黨政相關(guān)的專業(yè)詞匯幾乎全轉(zhuǎn)寫對(duì)了!”
兩會(huì)政府報(bào)告轉(zhuǎn)寫結(jié)果,準(zhǔn)確率近99%
近期,有不少記者使用了靈云語(yǔ)音云轉(zhuǎn)寫了兩會(huì)相關(guān)內(nèi)容的錄音后,紛紛表示識(shí)別準(zhǔn)確率大幅提高,像“第十三個(gè)五年規(guī)劃綱要草案”、“全面建成小康社會(huì)”、“戶籍人口城鎮(zhèn)化率”等等黨政領(lǐng)域的專業(yè)詞匯都轉(zhuǎn)寫的十分準(zhǔn)確。
如何造就變態(tài)準(zhǔn)的識(shí)別率?
本次識(shí)別準(zhǔn)確率提升明顯的良好體驗(yàn),得益于捷通華聲針對(duì)語(yǔ)音云靈云樂說的語(yǔ)音識(shí)別技術(shù),在核心ASR引擎的升級(jí)和語(yǔ)言模型的定制領(lǐng)域訓(xùn)練優(yōu)化。
語(yǔ)音識(shí)別系統(tǒng)結(jié)構(gòu)框圖
從語(yǔ)音識(shí)別原理來講,影響語(yǔ)音識(shí)別準(zhǔn)確率很重要的因素在于語(yǔ)音識(shí)別系統(tǒng)的模型,一般包括聲學(xué)模型、語(yǔ)言模型兩部分,捷通華聲通過領(lǐng)先的人工智能技術(shù),在兩方面針對(duì)黨政會(huì)議的錄音均進(jìn)行了針對(duì)性的優(yōu)化。
聲學(xué)模型是從語(yǔ)音信號(hào)中抽取的特征到音節(jié)概率的計(jì)算。作為語(yǔ)音識(shí)別系統(tǒng)的重要組成部分,它占據(jù)著語(yǔ)音識(shí)別大部分的計(jì)算開銷,決定著語(yǔ)音識(shí)別系統(tǒng)的性能。捷通華聲通過將最新推出的全新一代靈云語(yǔ)音識(shí)別引擎,對(duì)建模單元粗粒度、模型訓(xùn)練方法、解碼幀率進(jìn)行創(chuàng)新優(yōu)化,有效提升了語(yǔ)音識(shí)別引擎的執(zhí)行效率、魯棒性,增強(qiáng)了口音、語(yǔ)速適配能力,大幅提升了聲學(xué)模型的效果,識(shí)別率得以實(shí)現(xiàn)跨越式提升。
語(yǔ)言模型是音節(jié)到字概率的計(jì)算。捷通華聲近期通過對(duì)語(yǔ)言模型進(jìn)行定制場(chǎng)景訓(xùn)練優(yōu)化,推出了專門針對(duì)黨政會(huì)議的語(yǔ)言模型,該模型將大量關(guān)于黨政會(huì)議、報(bào)告的語(yǔ)音及文本語(yǔ)料放入其中進(jìn)行了訓(xùn)練優(yōu)化,面對(duì)涉及黨政相關(guān)的領(lǐng)域詞匯,實(shí)現(xiàn)了更好的匹配度,從而面對(duì)專業(yè)領(lǐng)域的錄音,有了更好的識(shí)別效果。
除了黨政會(huì)議領(lǐng)域,靈云語(yǔ)音云還擁有新聞媒體、會(huì)議辦公、情感寫作、IT科技、影視娛樂、醫(yī)療保險(xiǎn)、法律法院務(wù)等多種領(lǐng)域的語(yǔ)言模型以供用戶選擇,滿足不同領(lǐng)域的音頻轉(zhuǎn)寫,幫助各行各業(yè)的用戶實(shí)現(xiàn)高效記錄和信息輸入。
在線轉(zhuǎn)寫編輯 邊聽邊改更高效
語(yǔ)音轉(zhuǎn)寫為文字后,為更好地提高文字整理效率,語(yǔ)音云還擁有在線分音頻節(jié)點(diǎn)編輯功能,用戶可以點(diǎn)擊任意需編輯的文字,系統(tǒng)會(huì)定位到該處文字的音頻節(jié)點(diǎn),然后邊聽該段音頻邊即時(shí)修改文字,哪里文字轉(zhuǎn)寫不準(zhǔn),可以隨時(shí)點(diǎn)擊定位到相應(yīng)錄音上進(jìn)行修改。
通常一段一小時(shí)的采訪錄音需要花三四個(gè)小時(shí)才能整理完,而有了這個(gè)強(qiáng)大功能,通過邊聽邊校對(duì),一小時(shí)的錄音聽完也就整理完了。并且,完全避免了整理錄音時(shí)聽著錄音手動(dòng)按下暫停,在word上敲打文字后再回來點(diǎn)擊繼續(xù)播放的復(fù)雜操作。
語(yǔ)音云直達(dá)鏈接
用戶可直接輸入網(wǎng)址:speech.aicloud.com即可進(jìn)入語(yǔ)音云網(wǎng)站,另外也可以登錄靈云平臺(tái)(www.aicloud.com)點(diǎn)擊語(yǔ)音云服務(wù)按鈕進(jìn)入。