產(chǎn)綜研開發(fā)利用語音直接檢索多媒體內(nèi)容的技術(shù)
2008/10/15
日本產(chǎn)業(yè)技術(shù)綜合研究所宣布,開發(fā)出利用語音直接檢索視頻共享網(wǎng)站等多媒體內(nèi)容的技術(shù)。并將公開基于該技術(shù)的檢索系統(tǒng)驗(yàn)證網(wǎng)站。除互聯(lián)網(wǎng)方面的應(yīng)用外,還設(shè)想應(yīng)用于呼叫中心通話錄音系統(tǒng)的語音檢索、以及使用大量多媒體內(nèi)容的廣播·教育領(lǐng)域。使用此次開發(fā)技術(shù)的檢索系統(tǒng)的驗(yàn)證網(wǎng)站
此次公開的檢索系統(tǒng),能夠利用關(guān)鍵詞直接檢索互聯(lián)網(wǎng)視頻共享網(wǎng)站和語音網(wǎng)站等多媒體內(nèi)容中包含的語音。由于不使用原檢索系統(tǒng)所必需的語音識(shí)別辭典,因此即使是包含新固有名詞和生詞的單詞,也可不受限制地作為檢索關(guān)鍵詞。另外,無需維護(hù)、可實(shí)時(shí)檢索互聯(lián)網(wǎng)上的新內(nèi)容。使用普通瀏覽器即可利用該系統(tǒng)。
檢索使用的是,比通常的語音檢索采用的音素更為細(xì)分、被認(rèn)為是可保留語言信息最小單位的“音素片(SPS: Sub-Phonetic
Segment)”。根據(jù)音素片進(jìn)行檢索,檢索處理的精度降低問題得以抑制,從而能夠?qū)崿F(xiàn)不使用辭典的檢索。作為檢索對(duì)象的數(shù)據(jù)、檢索關(guān)鍵詞均按照音素片單位進(jìn)行拆分·編碼,將符號(hào)間的匹配數(shù)值化并進(jìn)行對(duì)照。這一對(duì)照處理方法中,也開發(fā)了自主高速處理算法。
檢索系統(tǒng)的構(gòu)成
由于不再依靠基于辭典的語言,較為容易支持多種語言及方言。另外,不僅可使用文字、還可通過語音輸入檢索關(guān)鍵詞。因此,老年人和殘疾人等難以用鍵盤輸入檢索語詞的用戶也能輕松利用該服務(wù)。
今后,產(chǎn)綜研將通過在用戶中招募試用者,驗(yàn)證該系統(tǒng)的有效性,面向?qū)嵱没M(jìn)行改進(jìn)。另外,還計(jì)劃促進(jìn)與原測(cè)試庫的語音檢索技術(shù)及多媒體內(nèi)容的分類·歸納等技術(shù)的融合,開發(fā)更為地道的媒體檢索技術(shù)。
此外,產(chǎn)綜研預(yù)定在2008年10月20~21日于產(chǎn)綜研筑波中心舉辦的“產(chǎn)綜研開放實(shí)驗(yàn)室”上公開該技術(shù)。
利用語音從多媒體內(nèi)容中檢索特定場(chǎng)景的
日經(jīng)BP社
恒融同北京農(nóng)商行合作開發(fā)“視頻銀行”亮相金融展 2008-10-13 |
訊鳥與金算盤攜手 共享網(wǎng)購(gòu)盛宴 2008-10-13 |
Aspect與微軟子公司Tellme合作提升聯(lián)絡(luò)中心語音平臺(tái) 2008-09-24 |
TouchStar呼叫中心支持NMS Open Access媒體處理平臺(tái) 2008-09-23 |
中國(guó)網(wǎng)通116114電話導(dǎo)航推出隨身號(hào)簿業(yè)務(wù) 2008-09-16 |