該系統(tǒng)實現(xiàn)了電話號碼中文語音輸入。它支持用戶一次說出完整的電話號碼,并自動完成由語音向文本的轉(zhuǎn)換,輸出用戶所說的電話號碼。在開車過程中,用戶可以隨時啟動語音識別,說出電話號碼后就可以直接撥打電話,從而免去了中途停車撥號的麻煩。
該系統(tǒng)提供非特定人語音標簽(SIVT)功能。非特定人語音標簽是基于最新的語音識別技術(shù)所開發(fā),使語音識別結(jié)果不受噪聲、用戶音色變化影響。甚至在更換用戶時,Aitalk3.0仍能正確識別。用戶在使用導航儀時,可以預先為某一個地名指定語音標簽,如指定為“公司”,在導航過程中說“導航到公司”,便可以直接導航到用戶所在的公司,簡單快捷,彰顯個性。
該系統(tǒng)還支持FM電臺號碼輸入功能——當用戶說出電臺頻率時,收音機將自動轉(zhuǎn)到特定的頻率。如用戶說“調(diào)頻九十八點八”,語音識別就可以幫助用戶將收音機調(diào)節(jié)到調(diào)頻98.8MHz。這一功能擴展了語音識別在汽車等設(shè)備中的應(yīng)用范圍,進一步提升娛樂系統(tǒng)的用戶體驗。
此外,Aitalk3.0擁有增強型語音活動檢測(EVAD,Enhanced VAD)技術(shù),為高噪環(huán)境下的準確識別提供了有力保障,產(chǎn)品的抗噪性能進一步提升;Aitalk3.0增強型英文識別技術(shù)則針對中國人說英文,以及中英文混合的發(fā)音特點,采用多語種混合模型,大大提升了英文識別和中英文混合識別的準確率,體現(xiàn)了“為中國人設(shè)計”的產(chǎn)品設(shè)計理念。
新一代語音識別系統(tǒng)Aitalk3.0的卓越性能和完善的應(yīng)用解決方案,將使用戶體驗到語音科技的無限魅力,為合作伙伴在市場競爭中脫穎而出提供強勁助力!科大訊飛將秉承為廣大客戶提供最優(yōu)技術(shù)產(chǎn)品,最具價值解決方案的理念,與業(yè)界合作伙伴共同促進語音市場快速健康發(fā)展,加速推進語音技術(shù)的應(yīng)用發(fā)展。
CTI論壇報道