得意音通成為中文語(yǔ)音交互技術(shù)標(biāo)準(zhǔn)工作組首批成員單位
2003/11/28
經(jīng)信息產(chǎn)業(yè)部科技司批準(zhǔn),北京得意音通技術(shù)有限責(zé)任公司、清華大學(xué)智能技術(shù)與系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室、清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系等19個(gè)單位正式成為中文語(yǔ)音交互技術(shù)標(biāo)準(zhǔn)工作組首批成員單位。
"中文語(yǔ)音交互技術(shù)標(biāo)準(zhǔn)工作組" (http://www.speechstandard.org.cn/)是由國(guó)內(nèi)產(chǎn)、學(xué)、研、用等企事業(yè)單位以及大專院校等自愿聯(lián)合組織、經(jīng)信息產(chǎn)業(yè)部科技司批準(zhǔn)成立的、組織開展中文語(yǔ)音交互領(lǐng)域技術(shù)標(biāo)準(zhǔn)制定和研究活動(dòng)的非營(yíng)利性技術(shù)工作組織。工作組成立于2003年10月,主要工作任務(wù)是:"研究并制定與中文語(yǔ)音交互技術(shù)有關(guān)的數(shù)據(jù)交換格式、系統(tǒng)架構(gòu)與接口、系統(tǒng)分類與評(píng)測(cè)及數(shù)據(jù)庫(kù)格式與標(biāo)注等方面的標(biāo)準(zhǔn)。"。
北京得意音通技術(shù)有限責(zé)任公司(http://www.d-ear.com)專業(yè)從事語(yǔ)音識(shí)別與語(yǔ)言理解技術(shù)研發(fā)和應(yīng)用,在語(yǔ)音技術(shù)領(lǐng)域有著非常深厚的技術(shù)積累,擁有三大核心技術(shù):自動(dòng)語(yǔ)音識(shí)別(ASR)技術(shù)、中文自然語(yǔ)言理解(CNLU)技術(shù)和聲紋識(shí)別(VPR)技術(shù)。得意公司的發(fā)展戰(zhàn)略是:以三大核心技術(shù)為基礎(chǔ),與國(guó)內(nèi)外公司和機(jī)構(gòu)開展廣泛深入的合作,為它們提供最佳的技術(shù)成果、解決方案和信息服務(wù)。得意公司的市場(chǎng)定位是:為硬件生產(chǎn)商、軟件開發(fā)商、系統(tǒng)集成商、通訊網(wǎng)絡(luò)運(yùn)營(yíng)商、通信增值服務(wù)平臺(tái)運(yùn)營(yíng)商等提供相應(yīng)的軟件應(yīng)用編程接口(API)/軟件開發(fā)工具(SDK),或者捆綁、集成定制的軟件系統(tǒng),主要的商業(yè)合作模式包括軟件授權(quán)以及信息服務(wù)分成。
清華大學(xué)智能技術(shù)與系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室(http://sp.cs.tsinghua.edu.cn/),1990年2月通過國(guó)家驗(yàn)收并對(duì)外開放運(yùn)行,
是信息技術(shù)領(lǐng)域處于全國(guó)領(lǐng)先地位的國(guó)家重點(diǎn)實(shí)驗(yàn)室,主要研發(fā)方向包括人機(jī)交互技術(shù)和自動(dòng)控制技術(shù),承接并出色完成過許多國(guó)家級(jí)重大基礎(chǔ)研究與應(yīng)用基礎(chǔ)研究項(xiàng)目。獲得很多國(guó)家級(jí)的科技成果獎(jiǎng),擁有相當(dāng)數(shù)量的專利技術(shù)。在國(guó)家科技部組織的全部三次評(píng)估中均被評(píng)為A級(jí),是全國(guó)信息類國(guó)家重點(diǎn)實(shí)驗(yàn)室中唯一的一個(gè)。國(guó)家重點(diǎn)實(shí)驗(yàn)室屬下的語(yǔ)音技術(shù)中心(CST),成立于1979年,主要從事的方向?yàn)檎Z(yǔ)音識(shí)別、聲紋識(shí)別、自然語(yǔ)言對(duì)話系統(tǒng)等。承擔(dān)過國(guó)家重點(diǎn)攻關(guān)任務(wù)、863項(xiàng)目、973項(xiàng)目、軍口預(yù)研任務(wù)、清華大學(xué)一流大學(xué)重點(diǎn)學(xué)科建設(shè)985項(xiàng)目,及許多國(guó)際和國(guó)內(nèi)合作項(xiàng)目等,多次獲獎(jiǎng);在國(guó)際國(guó)內(nèi)的會(huì)議和各種學(xué)術(shù)刊物上發(fā)表論文數(shù)百篇;研發(fā)了數(shù)十項(xiàng)語(yǔ)音產(chǎn)品。1990年參與發(fā)起全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC);多次主持主持國(guó)內(nèi)外重要的語(yǔ)音學(xué)術(shù)會(huì)議。國(guó)家重點(diǎn)實(shí)驗(yàn)室屬下的智能信息處理課題組自1995年開始語(yǔ)音信號(hào)處理的工作。主要是承擔(dān)的國(guó)際合作項(xiàng)目,進(jìn)行了語(yǔ)音識(shí)別、說(shuō)話人識(shí)別等方面的研究。理論方面提出具有動(dòng)態(tài)閾值的說(shuō)話人模型、全局說(shuō)話人模型、分段概率語(yǔ)音識(shí)別模型,及有關(guān)連續(xù)語(yǔ)音訓(xùn)練、時(shí)間駐留信息處理等等,其論文已在IEEE
Trans. on SMC、《計(jì)算機(jī)學(xué)報(bào)》等國(guó)內(nèi)外刊物發(fā)表。除此之外,還進(jìn)行了小波變換、神經(jīng)網(wǎng)絡(luò)等理論在語(yǔ)音識(shí)別上的應(yīng)用的研究。發(fā)表論文30余篇。
語(yǔ)音是人們獲取和溝通信息最方便、最有效的手段。近幾年來(lái),語(yǔ)音技術(shù)的應(yīng)用已經(jīng)深入到人們生活的方方面面。從電信、交通、稅務(wù)、銀行、證券、保險(xiǎn)等行業(yè)到企業(yè)和家庭用戶,從PC到手機(jī)再到MP3和玩具,其應(yīng)用幾乎無(wú)所不在。
隨著語(yǔ)音技術(shù)和應(yīng)用的逐步成熟,市場(chǎng)需求增大的同時(shí),面臨著復(fù)雜系統(tǒng)互聯(lián)的問題,如當(dāng)前應(yīng)用廣泛的160/168聲訊服務(wù)、電話銀行、語(yǔ)音門戶、無(wú)線通信業(yè)務(wù)等等,集成系統(tǒng)的復(fù)雜性呈指數(shù)級(jí)上升。在系統(tǒng)的互聯(lián)接口、內(nèi)容交換數(shù)據(jù)格式等方面沒有一個(gè)大家共同遵循的標(biāo)準(zhǔn),其開發(fā)難度、維護(hù)難度和運(yùn)營(yíng)難度是難以想象的。語(yǔ)音合成、語(yǔ)音識(shí)別引擎怎樣與電話設(shè)備、后臺(tái)數(shù)據(jù)庫(kù)、地理信息、無(wú)線定位等其他組成部分完成通信并和平共處,怎樣將不同廠商的產(chǎn)品根據(jù)統(tǒng)一的應(yīng)用場(chǎng)景需要加以集成,成了遏制語(yǔ)音應(yīng)用大規(guī)模發(fā)展的絆腳石。
而國(guó)際上,跨國(guó)巨頭對(duì)語(yǔ)音市場(chǎng)垂涎已久,國(guó)際相關(guān)語(yǔ)音標(biāo)準(zhǔn)發(fā)展迅速,形成了VXML和SALT兩大語(yǔ)音標(biāo)準(zhǔn)陣營(yíng),并各自都獲得了廣泛的支持。另外國(guó)際巨頭也紛紛推出各自的應(yīng)用框架和標(biāo)準(zhǔn)全面進(jìn)入中國(guó),憑借其既成事實(shí)的開發(fā)案例使得國(guó)內(nèi)廠商難以進(jìn)入。
制定中文語(yǔ)音有關(guān)標(biāo)準(zhǔn),對(duì)促進(jìn)中文語(yǔ)音技術(shù)應(yīng)用、推動(dòng)中文語(yǔ)音產(chǎn)業(yè)發(fā)展、增強(qiáng)民族軟件核心競(jìng)爭(zhēng)力均具有非常重要的意義。國(guó)家信息產(chǎn)業(yè)部科技司在廣泛調(diào)研、認(rèn)真征求專家意見的基礎(chǔ)上,于2003年10月在合肥主持召開了"中文語(yǔ)音交互技術(shù)標(biāo)準(zhǔn)工作組"成立大會(huì)。
得意音通公司供稿 CTI論壇編輯
相關(guān)鏈接: