全球知名語音學術大會INTERSPEECH2019于9月15日至19日在奧地利格拉茨城市舉行。
作為全球智能語音及AI數(shù)據(jù)發(fā)展的推動者,標貝科技受邀成為大會黃金級贊助廠商亮相現(xiàn)場。其中,由標貝語音團隊撰寫的《A Mandarin Prosodic Boundary Prediction Model Based on Multi-Task Learning》論文成功入選會議,并在現(xiàn)場向來自全球的語音科研機構及企業(yè)廠商展現(xiàn)標貝語音科研創(chuàng)新及產(chǎn)品動態(tài)。
全球語音交流協(xié)會INTERSPEECH是世界上規(guī)模最大、內容最全面的語音會議。今年恰逢INTERSPEECH成功舉辦20周年,會議以“Crossroads of Speech and Language”為主題,意在探討語言多樣性、應用多樣性以及表達方式多樣性,吸引了來自世界各地的近2000名科研學者及企業(yè)廠商代表。
歷屆INTERSPEECH會收到來自全球上千家科研機構及企業(yè)廠商投稿,而最終入選的數(shù)量卻十分有限。緣由國際權威評委的嚴格標準。本次標貝論文入選大會,體現(xiàn)了中國AI語音廠商在國際語音領域的不俗實力。該論文提出了一種基于多任務學習(MTL)架構的中文普通話韻律邊界預測模型。研究結論表明,該模型有效地解決了普通話韻律邊界預測的任務,整體預測性能提高了0.8%,模型尺寸減小了約55%。對語音行業(yè)研究中文普通話語音合成效果質量提升提供了一定的研究參考價值。
據(jù)了解,標貝科技語音及數(shù)據(jù)核心團隊人員擁有超過15年行業(yè)經(jīng)驗,擁有業(yè)內領先的語音合成技術及數(shù)據(jù)方案能力,為全球客戶提供高品質、多類別、多場景的語音合成方案,以及高質量、安全與多語種為特點的數(shù)據(jù)服務。截至目前,標貝科技已為微軟、百度、阿里、騰訊、字節(jié)跳動等海內外100余家企業(yè)客戶提供服務,項目累計超過300項,涵蓋汽車、教育、客服、零售、閱讀、智能硬件等應用領域。
標貝科技自成立以來,把AI技術創(chuàng)新放在首位,以“語音連接場景、數(shù)據(jù)服務技術為理念”,在技術、數(shù)據(jù)及應用三端不斷創(chuàng)新,確保在語音和數(shù)據(jù)領域的領先地位。
例如,在語音合成方面上,標貝基于Attention機制的深度神經(jīng)網(wǎng)絡技術,充分利用文本數(shù)據(jù),構建前端模塊、選擇合適的聲碼器,降低運算量,創(chuàng)新語音合成模型,提升語音合成質量效果,并匹配場景應用。以出色的語音技術實力、場景連接能力,贏得客戶信任與認可。此外,標貝還自主創(chuàng)新研發(fā)TTS評測系統(tǒng),從前/后端為行業(yè)提供評測標準指南,提升語音評測質量整體發(fā)展。
同時,在高校科研合作方面,標貝與北京大學、西北工業(yè)大學、新加坡國立大學等國際高校建立合作關系,以此獲得強有力的產(chǎn)研力量支持。
本屆INTERSPEECH2019,標貝科技收獲了海外多個地區(qū)科研機構和海外客戶對標貝自有語音合成方案的認可。未來,標貝科技將與更多科研高校、企業(yè)廠商保持緊密的交流合作,攜手共同推動語音產(chǎn)業(yè)的發(fā)展。
完整版論文鏈接:
https://www.isca-speech.org/archive/Interspeech_2019/pdfs/1400.pdf