科大訊飛語音識別技術取得重大進展 說話人識別勇奪國際大賽第一
2008/06/06
在剛剛結束的“2008 NIST Speaker Recognition Evaluation”——國際說話人識別評測大賽上,科大訊飛語音實驗室送評的識別系統(tǒng)獲得綜合指標第一名的優(yōu)異成績。這是繼科大訊飛2006、2007年蟬聯(lián)國際英文合成大賽(Blizzard Challenge 2006/2007)第一名后,在語音研究國際大賽上獲得的又一殊榮。本次大賽表明科大訊飛已經在全球語音技術領域內取得了從語音合成到語音識別技術的全面領先地位,“能聽會說”的完整解決方案將對科大訊飛為代表的我國語音產業(yè)發(fā)展具有重大戰(zhàn)略意義!
說話人識別技術,又稱話者識別或聲紋識別,是語音識別技術的重要方向和應用領域。該技術通過語音信號提取代表說話人身份的相關特征(如反映聲門開合頻率的基頻特征、反映口腔大小形狀及聲道長度的頻譜特征等),從而識別出說話人的身份。其可以廣泛應用于軍事、國家安全和各產業(yè)領域。
作為國際上規(guī)模與影響力最大、由NIST(美國國家標準技術研究院)從1997年開始舉辦的歷屆說話人識別評測大賽(http://www.nist.gov/speech/tests/sre/),都是國際一流的科研單位和企業(yè)角逐說話人識別技術桂冠的競技平臺。本屆大賽的參賽單位達到了創(chuàng)記錄的43家,其中包括CMU(美國卡耐基-梅隆大學)、MIT(美國麻省理工學院),Stanford(美國斯坦福大學),BUT(捷克博諾技術大學)、Motorola研究中心、IBM研究院等世界著名語音研究機構,國內單位還有清華大學、中科院聲學所和中科院自動化所參賽。
科大訊飛一直以國際領先的語音合成技術而聞名,而語音識別研究此前一直在默默耕耘。此前業(yè)界普遍認為中國語音識別研究距離美國、日本等發(fā)達國家尚有不小差距。而經過近年來在語音識別技術上腳踏實地的堅持努力,科大訊飛已經積累了深厚的語音識別研究基礎并組建了高水平研發(fā)團隊。這次在時間緊、對手強的競爭壓力下首次參賽就一舉獲得殊榮,大大激勵了中國語音識別研究隊伍的士氣。在本次大賽的三項測試指標“識別等錯誤率(EER)、最小檢測代價(minDCF)、檢測代價(DCF)”中,科大訊飛語音實驗室報送的USTC-iFly系統(tǒng)獲得EER、minDCF兩項第一名、DCF第三名的優(yōu)異成績。此外,科大訊飛語音實驗室與新加坡信息研究所(IIR)等合作報送的I4U系統(tǒng)獲得了EER、minDCF兩項第二名,DCF第一名的優(yōu)異成績?拼笥嶏w這一突出表現(xiàn)也再次引起了全球語音界的矚目。
作為業(yè)界公認的“中文語音產業(yè)國家隊”,長久以來科大訊飛一直堅持“產學研用”相結合的創(chuàng)新機制,其在語音合成技術上一直保持絕對領先的優(yōu)勢。研發(fā)的中英文語音合成、口語評測技術都處于國際領先水平,應用產品占據了主流應用領域70%以上的市場份額,并在牽頭制定中文語音的國家標準?拼笥嶏w語音實驗室是中國科技大學和科大訊飛公司聯(lián)合建立的研究機構,在國家863項目和國家自然科學基金委的長期支持下,專門致力于語音及語言技術的研究與產業(yè)化。此次在在語音識別研究上的一個重大突破對科大訊飛語音產業(yè)的發(fā)展有著重要的戰(zhàn)略意義。標志著科大訊飛已經在語音合成、語音識別、口語評測等語音關鍵技術上處于全方位國際領先水平,可以為各行業(yè)合作伙伴提供更為完整的“能聽會說”語音解決方案。這一進展對鞏固科大訊飛產業(yè)領導者地位和拉動語音技術在各行業(yè)深入應用都將起到積極促進作用。
作為全國唯一以語音技術為主要產業(yè)化方向的“國家863計劃成果產業(yè)化基地”、“國家規(guī)劃布局內重點軟件企業(yè)”和“國家火炬計劃重點高新技術企業(yè)”,科大訊飛將繼續(xù)致力于為各行業(yè)合作伙伴提供最優(yōu)的技術、最完整的產品方案及最優(yōu)質的服務,加大產業(yè)化力度,通過語音技術的進步為大眾百姓更便捷的獲取信息服務做出自己的努力。
CTI論壇編輯
相關鏈接: