Google推視頻語音識別技術 將"政客"作為關注焦點
2008/09/17
9月17日國際報道 今年7月份,谷歌推出了應用于網絡應用的語音識別技術,目前這一項目Gaudi(谷歌音頻索引)在Google Labs有一個正式界面。
網站的搜索框上有使用說明事例,如“搜索政治家的講話”,就會在YouTube視頻播放器旁邊顯示搜索結果,點擊每一個結果,播放器就會顯示講話地點的一段視頻。顯示結果不僅僅顯示演講,如果點擊“絕路橋”,還可以看到一段由約翰·麥凱恩和莎拉·帕琳參加競選的廣告。
從視頻中提取話語,將有助于谷歌輕易決定視頻的內容,并在視頻旁邊配置最適宜的廣告。今年通過YouTube賺錢是谷歌的頭等大事。
語音與文本之間的轉換還將有助于谷歌將相關視頻混合到搜索結果中。目前最好的辦法就是通過檢查伴隨的元數據理解視頻中的內容,例如標題與說明,但其范圍要比所說的語言范圍小得多。
借助于谷歌的翻譯工具,谷歌有可能將視頻內容翻譯成其它語言。顯然,谷歌在語音識別技術方面有更大的雄心。谷歌在FAQ網頁上談論到谷歌音頻索引項目時表示:“Google Labs上的谷歌音頻索引項目應用范圍將更廣,美國競選只是第一步。我們將把谷歌音頻索引項目視作一個實驗平臺,通過這一平臺,我們可以發(fā)現用戶尋找網絡演講內容時獲得最佳體驗的一些功能!
谷歌之所以選擇政治家的信息,是因為政治家引起的關注更高,另外,政治家的語言往往比普通人的語言更簡潔,語音識別技術的執(zhí)行效果會更好。
CNET科技資訊網(www.cnetnews.com.cn)
相關鏈接: