新一代靈云語音識(shí)別演示(建議全屏觀看)
此次靈云語音識(shí)別技術(shù)的升級(jí),是捷通華聲在CTC算法的基礎(chǔ)上,對(duì)建模單元粗粒度、模型訓(xùn)練方法、解碼幀率進(jìn)行創(chuàng)新優(yōu)化。有效提升了語音識(shí)別引擎的執(zhí)行效率、魯棒性,增強(qiáng)了口音、語速適配能力,大幅提升了多人對(duì)講、遠(yuǎn)場(chǎng)講話等場(chǎng)景中的語音識(shí)別率。
調(diào)用云端語音識(shí)別服務(wù)就上靈云平臺(tái)
新一代靈云語音識(shí)別技術(shù)已上線靈云平臺(tái),開發(fā)者可以去靈云開發(fā)者社區(qū)(aicloud.com/dev/)申請(qǐng)調(diào)用。
開發(fā)者將靈云語音識(shí)別SDK集成到ISO、JAVA、安卓、Windows等軟件應(yīng)用中后,填寫申請(qǐng)到的靈云平臺(tái)語音識(shí)別服務(wù)地址、授權(quán)信息,便可免費(fèi)調(diào)用靈云平臺(tái)的語音識(shí)別服務(wù)。
目前,靈云平臺(tái)上的語音識(shí)別技術(shù)已服務(wù)包括打車軟件、輸入法、翻譯APP、手機(jī)銀行客戶端等各類數(shù)十萬應(yīng)用,覆蓋數(shù)億終端用戶。
靈云ASR能力平臺(tái)為政企單位提供私有、專業(yè)的語音識(shí)別能力
在提供公有云ASR能力的同時(shí),捷通華聲一直在為Callcenter、會(huì)議、公安等場(chǎng)景提供私有化的語音識(shí)別能力。
其中,在Callcenter電話信道8K語音識(shí)別場(chǎng)景,捷通華聲已服務(wù)眾多大型銀行客服中心、客服BPO中心,將海量語音實(shí)時(shí)轉(zhuǎn)寫為文字,為智能質(zhì)檢、智能客服、智能外呼、數(shù)據(jù)分析等提供私有云的語音識(shí)別能力。
在會(huì)議、司法、醫(yī)療等16k語音識(shí)別場(chǎng)景,捷通華聲積累了大量聲學(xué)、語言數(shù)據(jù),分別推出了會(huì)議、審訊、醫(yī)療各科室等行業(yè)版的語音識(shí)別能力平臺(tái),為政企客戶提供專業(yè)、私有、更安全的語音識(shí)別能力。
十多年來,捷通華聲始終堅(jiān)持核心技術(shù)自主研發(fā)。隨著此次靈云語音識(shí)別技術(shù)的跨越式提升,捷通華聲將為公有云開發(fā)者、政企客戶提供識(shí)別率更高、更優(yōu)質(zhì)的語音識(shí)別能力與服務(wù)。