語音識別技術(shù)擁有足夠高的評價(jià),但一直以來缺乏足夠的表現(xiàn)。由于無法精確的識別人類語音的表達(dá),使人們在使用語音識別技術(shù)的時(shí)候總會遇上各種各樣的錯(cuò)誤,結(jié)果就是人們無法通過語音直接打電話和寫短信。不過,這一切都有可能改變,關(guān)鍵詞又是蘋果(Apple)。
蘋果去年4月收購一家名為 Siri 的公司,該公司之前推出了一個(gè)應(yīng)用,能夠識別人們的語音,針對人們提出的問題進(jìn)行回答。Siri 所使用的語音識別技術(shù)由在該領(lǐng)域浸淫已久的 Nuance 所開發(fā)的。此后,蘋果與 Nuance 一直保持接觸,并取得了專利授權(quán),現(xiàn)在大家都知道了,蘋果將在 iOS 5 整合名為 Dragon 的語音識別技術(shù)。因此,iOS 5 也許會內(nèi)建語音識別接口(API)供開發(fā)者調(diào)用。
而這,有可能讓蘋果開啟下一扇人機(jī)交互的大門。
語音識別技術(shù)已經(jīng)足夠成熟
Dragon 語音識別引擎是相當(dāng)?shù)某墒,?iOS 平臺上使用該引擎的 Dragon Dictionary 以極高的識別精確度,效果讓人驚異。而 Android 平臺上由 Nuance 推出的 FlexT9,即使售價(jià)為 5 美元都收到 1100 份評論,以及平均 4 顆星的評價(jià)。可見語音識別技術(shù)已經(jīng)邁向成熟,能耐得住市場的考驗(yàn)。
Google 也注意到語音識別技術(shù)的潛力。之前 Google 從 Nuance 中挖來了一位創(chuàng)始人,在 Nuance 工作十年之久的專家。如今用于 Android 上的語音識別技術(shù)被 Slate 評價(jià)為“確實(shí)可用”。即使拐著彎問的問題也難不倒它,比如說一英里等于多少埃(計(jì)量單位 1 埃 = 1.0 × 10 -10 米)這樣。
在手機(jī)越變越大,觸控屏越來越流行的情況下,語音識別技術(shù)讓人能夠用一只手來操作手機(jī),提供了方便。至少,有短信來的時(shí)候不必痛苦的按虛擬鍵盤,只需要動動嘴巴就行了。
蘋果知道如何讓用戶接受新的操控方式
盡管語音識別技術(shù)已經(jīng)足夠成熟,但未必就能讓如今的手機(jī)更加易用。因?yàn)樾碌牟僮鞣绞降扔诟淖冇脩暨^往的習(xí)慣,這等于用戶過往的經(jīng)驗(yàn)全不管用。假如手機(jī)提供了語音識別功能,但用戶都不去用的話,這項(xiàng)技術(shù)即使再革新也沒有意義。
因此 Nuance 引導(dǎo) FlexT9 的用戶到一系列的視頻教程去,讓用戶明白如何操作。作為反例,Slate 指出 Android 的語音識別技術(shù)不夠人性,用戶需要念出“逗號”、“句號”才能輸入標(biāo)點(diǎn)符號。
而蘋果能夠讓消費(fèi)者輕易地接受新的科技:第一個(gè) iPhone 廣告其實(shí)是一個(gè)教程,消費(fèi)者從廣告中就學(xué)會如何利用 iPhone 上網(wǎng)、收發(fā)郵件以及搜索附近的商店。最終,消費(fèi)者接受了觸摸操控,也成就了 iPhone 的輝煌。
如今,語音識別技術(shù)也是一種新的操控方式,而蘋果是去做推廣的廠商。至少蘋果不會只通過枯燥的視頻教程來讓用戶學(xué)會如何用語音來操控手機(jī)。
蘋果是用戶體驗(yàn)大師
一個(gè)產(chǎn)品有成熟的技術(shù),和成功的推廣,也未必能夠留住用戶的心。
在 iPhone 之前已經(jīng)有很多款使用觸控屏的手機(jī)出現(xiàn)了,但是蘋果的長處就是讓科技變得簡單易用,貼合人性。這使 iPhone 完成了手機(jī)的設(shè)計(jì)上的革命。現(xiàn)在人們已經(jīng)忘卻了實(shí)體鍵盤,忘卻了軌跡球,取而代之的是一整塊觸控屏。
通過深度整合語音識別技術(shù),相信蘋果還能讓變革再一次發(fā)生,至少可以讓人們對著手機(jī)說幾句話就能發(fā)一條短信或?yàn)g覽網(wǎng)頁。而對于開發(fā)者來說,語音識別技術(shù)無疑開啟另一扇大門,讓他們的應(yīng)用設(shè)計(jì)更具有想象力。
我們?nèi)匀粺o法得知蘋果和 Nuance 合作的具體內(nèi)容,但我們有理由相信蘋果能夠成功的把語音識別技術(shù)帶入移動領(lǐng)域。
ifanr.com