神奇的語音技術(shù) 丟掉你的鍵盤擁抱語音搜索
2011/09/07
有沒有想過不論是手機(jī)還是電腦,都可以丟開鍵盤或鼠標(biāo),只要大聲對搜索引擎說出你想要的,就能得到答案?下一代搜索技術(shù)之一“語音搜索”,能夠幫你實現(xiàn)這些愿望。
谷歌的語音搜索
在兩個月前亞太地區(qū)的“移動革命”大會上,谷歌工程師對著手機(jī)說“World Cup Soccer 2011”,顯示的是關(guān)于這次女足世界杯比賽的信息,你會發(fā)現(xiàn),日本女足取得了世界杯冠軍;他又對著手機(jī)說“東京玩具商店地圖”,則真的出現(xiàn)了一張標(biāo)注了玩具商店地址的谷歌地圖。這就是谷歌最新的語音搜索技術(shù)。
6月14日,谷歌針對PC也發(fā)布了這一技術(shù)。谷歌并沒有把手機(jī)語音搜索功能簡單地移植到桌面,PC版語音搜索更為接近自然用戶界面,而這種界面也是計算機(jī)開發(fā)者幾十年來不斷的追求。PC版語音搜索與智能手機(jī)版差別不大。與輕拍手機(jī)屏幕的話筒圖標(biāo)不同,用戶可在Chrome瀏覽器中點擊www.google.com搜索框的話圖標(biāo)。當(dāng)然,用戶需要把電腦連接話筒,或者佩戴耳麥。語音搜索可識別覆蓋全球約50億人的27種語言和方言,但用戶界面目前還只有美式英文一種版本。8月25日,谷歌地圖也發(fā)布了語音搜索功能鍵,用戶可以直接用語音進(jìn)行地點查詢。據(jù)悉,此項新增服務(wù)是在6月發(fā)布的谷歌語音搜索的補(bǔ)充,用戶可以通過計算機(jī)麥克風(fēng)錄入自己的目的地,進(jìn)行地圖搜索。該設(shè)計的目的是為了簡化地圖搜索,比如要查找一條名字拼寫繁瑣的街道,用戶就可以采取語音輸入的方式,只需要說明“從A地到B地”。
“谷歌想要消除橫亙在用戶和想尋求的信息之間的所有障礙。具體到語音搜索,我們的目標(biāo)是讓用戶隨時隨地能夠使用語音識別技術(shù),只要需要打字的地方,都可以用說話來代替。”谷歌語音搜索研究科學(xué)家Pedro Moreno在接受《電腦報》記者采訪時表示,因為手機(jī)鍵盤和屏幕都很小,并且在觸摸屏上很容易打錯,打字會比較困難。但通過語音搜索,用戶可以不再被這些問題所困擾,只需說出想要找的內(nèi)容,就可以簡單、快速地進(jìn)行搜索。這對于那些輸入困難的語言尤為重要,比如中文、韓語、日語、希伯來語、阿拉伯語等。
據(jù)了解,相比傳統(tǒng)輸入,語音搜索功能可以容納更長的拼讀內(nèi)容。Google語音搜索還有一項有趣的功能,當(dāng)用戶拼讀算術(shù)題時,Google可以迅速提供計算結(jié)果。不過,目前,谷歌的語音搜索產(chǎn)品還并不是很成熟,辦公室、室外等嘈雜的環(huán)境會影響它的搜索結(jié)果。
無障礙搜索的愿景
自電腦誕生以來,讓電腦聽懂人們的說話,一直是IT從業(yè)者的一大心愿。在單機(jī)時代,IBM是最早進(jìn)行語音識別技術(shù)研究的企業(yè),在上個世紀(jì)90年代就推出可用于聲控打字和語音導(dǎo)航的語音識別輸入軟件IBM ViaVoice VIA。用戶只要對著電腦講話即可輸入漢字,輸入速度能達(dá)到150個漢字,幾乎是鍵盤輸入的2倍、普通手寫輸入的6倍。盡管售價不菲,但這套軟件在全球已售出100多萬套。漢王科技當(dāng)年正是基于這套軟件,開發(fā)出了基于語音和手寫識別的手持設(shè)備。
在比爾·蓋茨預(yù)測的未來十年最重要的技術(shù)進(jìn)步中,語音識別技術(shù)位居首位。微軟則從Windows XP開始,在操作系統(tǒng)中添加了語音識別功能,在新推出的Windows 7里這一功能更為完善。不用鍵盤鼠標(biāo),用戶可以通過語音對計算機(jī)進(jìn)行簡單的控制,如說一句“打開瀏覽器”,就可以輕松地打開IE。而Exchange Server 2010中則有更加先進(jìn)的語音郵件預(yù)覽功能,可以自動為語音郵件提供文本預(yù)覽。不方便收聽語音郵件的情況下用戶可以先通過語音郵件預(yù)覽來了解郵件的大致內(nèi)容,也可以通過閱讀文本預(yù)覽來決定郵件的優(yōu)先順序。
不過,真正讓語音搜索為人們所知和應(yīng)用的還是在手機(jī)上的嘗試。手機(jī)的演化也為語音搜索的實現(xiàn)提供了硬件基礎(chǔ),F(xiàn)在幾乎所有手機(jī)都擁有錄音、照相等功能,智能手機(jī)的出現(xiàn)則讓手機(jī)從一個單純的通話裝置變成一臺小型的計算設(shè)備。
越來越多的公司意識到,移動搜索領(lǐng)域會呈現(xiàn)與互聯(lián)網(wǎng)搜索截然不同的人機(jī)交互方式。早在2008年,谷歌在美國發(fā)布了英文語音搜索服務(wù)Voice Search,應(yīng)用于Android、諾基亞(微博)S60、黑莓、iPhone等多個系列的手機(jī)。據(jù)Pedro Moreno介紹,從那時起,谷歌已經(jīng)將語音識別擴(kuò)大到Android手機(jī)的每一個應(yīng)用程序的每一個文字輸入欄。
谷歌的競爭對手微軟也早早地進(jìn)行了布局。2007年,微軟收購了領(lǐng)先的手機(jī)語音識別服務(wù)廠商TellMe,組成了微軟現(xiàn)在的語音團(tuán)隊,TellMe為包括411商務(wù)搜索、1-800-555的信息搜索以及美國航空在內(nèi)的企業(yè)提供語音平臺。微軟新的語音團(tuán)隊最大的任務(wù)就是把語音搜索技術(shù)與Windows Mobile整合起來,移動版Bing搜索在三星(微博)手機(jī)上已經(jīng)實現(xiàn)與谷歌類似的語音搜索功能。
蘋果也在布局語音搜索這個領(lǐng)域。2010年4月蘋果收購了手機(jī)語音搜索廠商Siri。不僅如此,它和語音識別廠商N(yùn)uance也保持著密切聯(lián)系。之前業(yè)界流傳,在iOS5中有望加入類似于語音轉(zhuǎn)文字或語音導(dǎo)航等高端功能。
近日,騰訊手機(jī)SOSO V1.0(安卓版)正式上線,而語音搜索功能是該軟件的亮點,用戶只要說出搜索信息,即能立即進(jìn)行搜索,大大簡化了手動輸入的操作流程。而前不久騰訊公司限量發(fā)售的小Q機(jī)器人產(chǎn)品也運(yùn)用了“語音搜索”功能,相關(guān)負(fù)責(zé)人在接受本報記者采訪時表示,集成語音搜索的小Q機(jī)器人產(chǎn)品未來希望能夠在很大程度去替代傳統(tǒng)的鼠標(biāo)和鍵盤,成為人們上網(wǎng)的新助手。
不過,手機(jī)搜索絕對不是終極目標(biāo),語音搜索功能將延伸為語音輸入,覆蓋到手機(jī)、電腦等各種終端上。
“過不了多久,關(guān)鍵詞搜索將會成為像電動打印機(jī)和黑膠唱片一樣的懷舊產(chǎn)品,寄托人們對往昔時光的回憶。”美國華盛頓大學(xué)計算機(jī)科學(xué)家奧倫·埃奇奧尼日前撰文稱,更好的搜索技術(shù)將能夠支持語音搜索,并對輸入的問題直接做出響應(yīng),或者是用自然的語言進(jìn)行搜索并獲得答案,而不是像現(xiàn)在這樣使用索引來實現(xiàn)。
電腦報
相關(guān)閱讀: