發(fā)表評(píng)論分享按鈕

手機(jī)語音搜索亟待突破中文識(shí)別技術(shù)瓶頸

2012/02/21

  “娛樂式嘗鮮”利于產(chǎn)品升級(jí)改進(jìn)

  在手機(jī)語音搜索這一年度移動(dòng)互聯(lián)網(wǎng)熱點(diǎn)領(lǐng)域,蘋果公司依舊是先行者。此前,蘋果公司推出了iPhone 4S,并在其中集成了Siri模塊——這使得用戶可以通過語音對(duì)手機(jī)進(jìn)行控制,同時(shí)也可以通過語音進(jìn)行搜索。蘋果公司巨大的行業(yè)示范效應(yīng)使得手機(jī)語音搜索的市場(chǎng)被引爆,各類語音搜索的應(yīng)用迅速涌現(xiàn)。

  近日,HTC旗艦級(jí)新機(jī)HTC Endeavour被曝出包含了一項(xiàng)名為“HTC Speak”的語音助理軟件;國(guó)內(nèi)熱門移動(dòng)互聯(lián)網(wǎng)應(yīng)用訂餐小秘書也推出了支持語音搜索餐廳功能的Android版及iPhone版客戶端。此前,百度、谷歌、騰訊、UC、科大訊飛等都陸續(xù)推出了自有移動(dòng)語音搜索應(yīng)用,一時(shí)間語音搜索似乎成為了未來智能終端的必備選項(xiàng)。

  事實(shí)上,與國(guó)外不同,目前國(guó)內(nèi)手機(jī)語音搜索市場(chǎng)雖然已具備了一定的用戶需求與初步的技術(shù)積累,但仍處在市場(chǎng)導(dǎo)入期階段。由于目前的技術(shù)現(xiàn)狀無法準(zhǔn)確識(shí)別國(guó)內(nèi)用戶相關(guān)需求,用戶多將其作為嘗鮮的娛樂工具而非應(yīng)用工具,可以看到,我國(guó)手機(jī)語音搜索應(yīng)用從起步到成熟仍將有較長(zhǎng)的路要走。

  Siri成功培養(yǎng)用戶習(xí)慣

  雖未被廣泛普及,但目前國(guó)內(nèi)手機(jī)語音搜索的市場(chǎng)發(fā)展基礎(chǔ)已經(jīng)形成。

  首先,手機(jī)語音搜索迎合國(guó)內(nèi)手機(jī)用戶需求。用戶在使用手機(jī)時(shí),有相當(dāng)比例的時(shí)間處在移動(dòng)狀態(tài)下,在這種狀態(tài)下,用戶視覺的使用需要在使用手機(jī)與其它行為(如觀察路況等)間進(jìn)行分配,因而無法專注地使用手機(jī)。而語音搜索則解決了這一問題,用戶可以通過“說”來提交需求,通過“聽”來獲得反饋,而不會(huì)影響用戶正常行為。

  其次,Siri成功引發(fā)了用戶語音搜索使用興趣,國(guó)內(nèi)手機(jī)語音搜索市場(chǎng)發(fā)展的引爆點(diǎn)已經(jīng)出現(xiàn)。在過去十多年中,蘋果公司一直作為行業(yè)引領(lǐng)者而存在,每當(dāng)其推出了新產(chǎn)品、新應(yīng)用后,用戶對(duì)其高度認(rèn)可,并將其作為流行趨勢(shì)來對(duì)待,而市場(chǎng)上也隨之會(huì)出現(xiàn)一系列的“借鑒者”,在產(chǎn)品的外觀、功能等諸多方面進(jìn)行借鑒。可以看到,當(dāng)Siri被集成到iPhone 4S中后,在其它各類應(yīng)用市場(chǎng)上,迅速出現(xiàn)了上百種與語音相關(guān)的應(yīng)用,并且凡是涉及到搜索的(包括搜索引擎以及各類應(yīng)用中所涉及到的搜索功能),也無一例外地加上了語音搜索模塊。

  第三,中文語音搜索的技術(shù)基礎(chǔ)已初步形成。語音搜索并非蘋果公司所獨(dú)創(chuàng),核心技術(shù)也并非完全掌握在蘋果公司處,這就使得語音搜索的廣泛應(yīng)用成為可能。語音搜索從技術(shù)本質(zhì)而言,是先對(duì)用戶所說的語句進(jìn)行語音識(shí)別,再根據(jù)識(shí)別的結(jié)果進(jìn)行搜索,并反饋用戶相應(yīng)結(jié)果。目前,科大訊飛、谷歌等企業(yè)歷經(jīng)多年的發(fā)展,通過語音庫(kù)、語義庫(kù)的構(gòu)建,已經(jīng)能夠較好地識(shí)別用戶的語音;而語義庫(kù)的構(gòu)建,也實(shí)現(xiàn)了機(jī)器對(duì)人自然語言的解讀,為更加精確反饋搜索結(jié)果奠定了基礎(chǔ)。同時(shí),移動(dòng)互聯(lián)網(wǎng)與云計(jì)算的發(fā)展,也使得基于在線龐大語音、語義庫(kù),實(shí)現(xiàn)精準(zhǔn)識(shí)別成為可能。

  中文識(shí)別難上加難

  盡管手機(jī)語音搜索市場(chǎng)基礎(chǔ)已經(jīng)形成,但是短期內(nèi)市場(chǎng)無法規(guī)模推廣,其根本原因在于目前技術(shù)仍不成熟。

  眾所周知,每個(gè)人的口音均有一定的差別,能夠準(zhǔn)確識(shí)別用戶在說什么,本身就是一件很困難的事,而中文的同音不同字情況較多,將用戶的語句識(shí)別為哪些詞組,還需要考慮上下文的具體情況,相比英文、德文等拉丁語系的一個(gè)發(fā)音明確對(duì)應(yīng)一個(gè)單詞而言,中文的識(shí)別難度無疑會(huì)更高。同時(shí),在中文中,同樣的一句話,在不同的語境中,具備了不同的含義,識(shí)別難度會(huì)更大,很難實(shí)現(xiàn)以自然語言進(jìn)行搜索,并準(zhǔn)確反饋搜索結(jié)果。

  此外,為了調(diào)用語音、語義庫(kù),以更加精準(zhǔn)地理解用戶的意思,目前不少語音搜索服務(wù)商的做法是將用戶所說的語音上傳到服務(wù)器,由服務(wù)器進(jìn)行識(shí)別,但這對(duì)網(wǎng)絡(luò)的速度、服務(wù)器的處理能力等提出了較高的要求。

  筆者曾對(duì)目前較為流行的谷歌語音搜索應(yīng)用進(jìn)行測(cè)試,發(fā)現(xiàn)其對(duì)標(biāo)準(zhǔn)普通話的理解尚可,但如果發(fā)音稍不準(zhǔn)確或者出現(xiàn)一些較為冷僻的詞匯,則識(shí)別準(zhǔn)確度就會(huì)出現(xiàn)明顯下降,需要手工調(diào)整;同時(shí),在光纖接入的Wi-Fi環(huán)境下,識(shí)別一句完整的話也需要數(shù)十秒的等待時(shí)間。

  音調(diào)類搜索或密集涌現(xiàn)

  從長(zhǎng)期發(fā)展趨勢(shì)上看,當(dāng)語音搜索技術(shù)達(dá)到成熟時(shí),手機(jī)將成為用戶的智能助理,用戶可以用自然語言向手機(jī)發(fā)出命令,手機(jī)快速完成用戶的請(qǐng)求,包括執(zhí)行相關(guān)應(yīng)用、反饋相關(guān)信息等,而目前的應(yīng)用如Siri,雖然具備了相應(yīng)的理念,但尚不能完全實(shí)現(xiàn)相應(yīng)的功能,特別是基于中文的應(yīng)用。

  為了推動(dòng)手機(jī)語音搜索產(chǎn)品加速步入成熟階段,在現(xiàn)階段,將有諸多廠商,按照手機(jī)語音搜索成熟階段的理念提供相應(yīng)產(chǎn)品,并不斷優(yōu)化。這些產(chǎn)品主要包括手機(jī)輸入法、搜索框的輸入、手機(jī)語音應(yīng)用等。它們?cè)诔跗诨蛟S并不成熟,用戶需要努力用標(biāo)準(zhǔn)的普通話發(fā)音,而不能用自己所常使用的說話方式,并且未必能夠得到精確的反饋結(jié)果,因此,此類產(chǎn)品往往被用戶嘗鮮式使用,并被當(dāng)作一種娛樂工具而非應(yīng)用工具,但是,在產(chǎn)品被用戶使用的過程中,廠商能夠不斷采集用戶的聲音、用戶語言,從而形成較為完善的語音庫(kù)、語義庫(kù),使得產(chǎn)品能夠逐步趨向成熟。

  同時(shí),手機(jī)語音搜索的另一個(gè)發(fā)展方向是音調(diào)搜索,例如用戶想搜索一首音樂,但他只能記得部分的聲音片段,如果他能夠哼唱出音調(diào),那么搜索工具同樣能夠支持搜索。預(yù)計(jì)在未來,此類產(chǎn)品將不斷涌現(xiàn)。

  總之,審視手機(jī)語音搜索的商業(yè)模式,筆者認(rèn)為其不能構(gòu)建獨(dú)立的商業(yè)模式,而將更多作為一種技術(shù)手段,支撐其它各類型應(yīng)用更好地發(fā)展,并且在不斷的信息搜集中,實(shí)現(xiàn)ICT產(chǎn)業(yè)的重要發(fā)展目標(biāo)之一,即人工智能的深入突破。

通信世界周刊



相關(guān)閱讀:
華為與芒果網(wǎng)合推最新應(yīng)用軟件“勢(shì)力邦” 2012-02-21
盛大語音平臺(tái)為開發(fā)者插上聲音的翅膀 2012-02-17
智能手機(jī)安全堪憂 安卓平臺(tái)危險(xiǎn)最大 2012-02-15
全球智能手機(jī)銷量首超PC 移動(dòng)互聯(lián)網(wǎng)引發(fā)跨界風(fēng) 2012-02-15
LinkedIn移動(dòng)領(lǐng)域發(fā)展迅速 欲將廣告植入應(yīng)用 2012-02-10

熱點(diǎn)專題:  移動(dòng)互聯(lián)網(wǎng)