口語學(xué)習(xí)的革命——得意口語學(xué)習(xí)系統(tǒng)
2004/10/09
一、得意口語學(xué)習(xí)系統(tǒng)簡介
得意公司擁有出色的語音識(shí)別技術(shù),可應(yīng)用于自動(dòng)化和智能化的漢語/英語口語練習(xí)與測(cè)試評(píng)價(jià),為口語學(xué)習(xí)者提供了一個(gè)全新的學(xué)習(xí)模式,將成為中國人學(xué)外語和外國人學(xué)漢語的重要工具,帶來新的一輪"學(xué)習(xí)的革命"。
"得意"口語學(xué)習(xí)系統(tǒng)的原理是基于語音音素及其他參數(shù)的提取與分割,將使用者的語音音素系列與標(biāo)準(zhǔn)模型的語音音素序列進(jìn)行自動(dòng)比對(duì),并將比對(duì)結(jié)果通過視圖形象而直觀地給出,從而對(duì)學(xué)習(xí)者的語音給出恰當(dāng)?shù)脑u(píng)價(jià)(比如對(duì)每個(gè)音素給出一個(gè)得分等),以幫助其改進(jìn)和提高口語發(fā)音,使其接近或達(dá)到語音的標(biāo)準(zhǔn)水平。由于利用可視化的朗讀評(píng)分等人機(jī)交互的方式,而且通過視覺、聽覺等綜合手段,反復(fù)提示和幫助用戶接近標(biāo)準(zhǔn)發(fā)音,因而顯著提高了學(xué)習(xí)者的學(xué)習(xí)興趣,這對(duì)提高英語學(xué)習(xí)成績有很多幫助。
二、得意口語學(xué)習(xí)系統(tǒng)強(qiáng)大的功能
得意口語學(xué)習(xí)系統(tǒng)主要功能包括:
- 發(fā)音自動(dòng)評(píng)分
- 發(fā)音修正建議
- 中、英文均可
……等等
功能具體說明:
。1)能夠顯示標(biāo)準(zhǔn)聲音和用戶錄音的聲調(diào)曲線,從而以形象的提示,輔助用戶的聲調(diào)發(fā)音聯(lián)系;
。2)能夠清楚地區(qū)分出音節(jié);
。3)能夠在一個(gè)連續(xù)的句子發(fā)音中,指出哪個(gè)音節(jié)的聲調(diào)不準(zhǔn)確,那個(gè)音節(jié)的發(fā)音有問題;
(4)能夠?qū)τ诰植窟M(jìn)行評(píng)分,能夠?qū)φw進(jìn)行評(píng)分。除識(shí)別單詞外,系統(tǒng)還將接收到的語音信號(hào)作出定位,并尋找出含有相關(guān)音段、音節(jié)及單詞的具體位置。為這些語言單位(音段、音節(jié)和單詞)產(chǎn)生出基準(zhǔn)測(cè)定,從而評(píng)定受測(cè)者的口語表達(dá)的內(nèi)容和流利程度。
三、得意口語學(xué)習(xí)系統(tǒng)廣泛的應(yīng)用
1、語言學(xué)習(xí)軟件/VCD--隨時(shí)可學(xué)的口語家教可把得意口語學(xué)習(xí)系統(tǒng)集成到語言學(xué)習(xí)軟件和VCD中,滿足不同層次、不同需求的各類用戶:
- 兒童英語學(xué)習(xí)
- 中小學(xué)英語學(xué)習(xí)
- 大學(xué)口語考試
- 商業(yè)英語
- 公務(wù)員英語
- 行業(yè)英語培訓(xùn)
- 外國人學(xué)中文
- 外國人中文口語考試
等等
2、復(fù)讀機(jī)/mp3口語學(xué)習(xí)--隨身攜帶的口語教師
可與復(fù)讀機(jī)/mp3配套使用,用戶可直接對(duì)著麥克風(fēng)朗讀,也可把錄音與標(biāo)準(zhǔn)模型對(duì)照,提供了更方便和全面的口語訓(xùn)練方案。
3、網(wǎng)絡(luò)遠(yuǎn)程口語培訓(xùn)--由你作主的口語教室
支持網(wǎng)絡(luò)遠(yuǎn)程服務(wù),系統(tǒng)可實(shí)時(shí)處理眾多用戶通過網(wǎng)絡(luò)傳來的語音,1臺(tái)普通的奔騰四PC服務(wù)器,并發(fā)處理能力為20~50個(gè)用戶(系統(tǒng)處理能力與業(yè)務(wù)流程設(shè)計(jì)有關(guān)),用戶可隨時(shí)上網(wǎng)選擇自己所需的內(nèi)容進(jìn)行個(gè)性化的學(xué)習(xí)和訓(xùn)練。
4、電話/網(wǎng)絡(luò)口語考試--公正權(quán)威的口語裁判
用戶可通過電話或者網(wǎng)絡(luò),接入得意的口語學(xué)習(xí)測(cè)試系統(tǒng),在系統(tǒng)的引導(dǎo)下,測(cè)試用戶的日常對(duì)話的整體能力、正確性和流暢性。此方案非常適合教育機(jī)構(gòu)、商業(yè)企業(yè)、政府部門方便、快捷、可靠、客觀地考核各類人才的口語能力和會(huì)話水平,應(yīng)用于優(yōu)秀人才聘用、工作能力考察、設(shè)定入學(xué)和畢業(yè)標(biāo)準(zhǔn)、評(píng)估教學(xué)成效等領(lǐng)域。
四、國際水平的得意語音識(shí)別技術(shù)
ASR是自動(dòng)語音識(shí)別(Automatic Speech Recognition)的縮寫,其目標(biāo)是讓計(jì)算機(jī)能夠辨別出人們所說的話的內(nèi)容。ASR通常有以下幾種分類方法:
(1) 特定人和非特定人;
(2) 小詞匯量、中詞匯量和大詞匯量;
(3) 語音命令(孤立詞)識(shí)別、關(guān)鍵詞檢出,以及連續(xù)語音識(shí)別(聽寫)等。
其中(1)語音命令識(shí)別引擎要求用戶所說的語音中最多只能含有一個(gè)詞表中定義的詞;(2)關(guān)鍵詞檢出引擎中則允許用戶所說的語音中除了含有一個(gè)或多個(gè)詞之外,還可以包含其它無關(guān)的內(nèi)容,識(shí)別器將只檢測(cè)出那些在詞表中定義過的詞,同時(shí)忽略其它無關(guān)的內(nèi)容;(3)連續(xù)語音識(shí)別引擎則會(huì)把用戶所說的語音逐字逐句地轉(zhuǎn)換為文字,是實(shí)現(xiàn)"聲音"到"文字"轉(zhuǎn)換的技術(shù),它的實(shí)現(xiàn)中涉及到聲學(xué)模型和語言模型:聲學(xué)模型用以從聲音信號(hào)中識(shí)別出"音(例如拼音)",而語言模型用以把"音"轉(zhuǎn)換成"字(例如有意義的文本語句)"。
得意非特定人語音命令識(shí)別API v3.0的特點(diǎn)有:非特定人、連續(xù)語音;孤立詞詞表可以更改;目前支持標(biāo)準(zhǔn)普通話;閾值 (或稱操作點(diǎn)) 可以調(diào)整;高效、精確、靈活、可靠;以及基于客戶端/服務(wù)器模式的框架結(jié)構(gòu) (多線程+多事件)。
(1) 非特定人:說話人不限年齡、性別、口音,只要基本上是說普通話即可;
(2) 連續(xù)語音:能夠識(shí)別連續(xù)語音。用戶可以自然地與得意接線員對(duì)話,不需刻意停頓或強(qiáng)調(diào)。
(3) 關(guān)鍵詞檢出:能夠從用戶所說的句子中檢出其中的關(guān)鍵詞如名字和部門等信息從而幫助用戶順利地轉(zhuǎn)接電話。
(4) 高識(shí)別率:對(duì)固定電話、手機(jī)電話等均能夠準(zhǔn)確地識(shí)別,正確識(shí)別率高達(dá)99%以上。
(5) 實(shí)時(shí)的語音識(shí)別:優(yōu)化設(shè)計(jì)的識(shí)別引擎使得得意接線員能夠?qū)崟r(shí)地為用戶實(shí)現(xiàn)電話接轉(zhuǎn)。
(6) 與硬件無關(guān):識(shí)別引擎不需要引入額外的硬件即可實(shí)時(shí)處理語音流。與電話卡無關(guān)的特性使得用戶可以基于任何電話卡構(gòu)建自己的語音互聯(lián)網(wǎng)絡(luò)系統(tǒng)。
得意公司的發(fā)展戰(zhàn)略是,與國內(nèi)外公司和機(jī)構(gòu)開展廣泛深入的合作,為它們提供最佳的技術(shù)成果、解決方案和信息服務(wù)。得意公司的市場定位是:為硬件生產(chǎn)商、軟件開發(fā)商、系統(tǒng)集成商、通訊網(wǎng)絡(luò)運(yùn)營商、通信增值服務(wù)平臺(tái)運(yùn)營商等提供相應(yīng)的應(yīng)用編程接口(API)和/或軟件開發(fā)工具包(SDK),或者捆綁、集成定制的軟件系統(tǒng)。
得意音通公司供稿 CTI論壇編輯
相關(guān)鏈接: