CTI論壇(ctiforum.com)(編譯/老秦):科技已經(jīng)趕上了人類最基本且是最強大的能力:我們的聲音。
如何解釋數(shù)字助理Siri、谷歌助理、Cortana、Alexa和最新進入者三星的Bixby的快速崛起?這些系統(tǒng)依靠語音指令而不是觸摸控制設(shè)備或應用程序,為我們提供了近乎無縫的訪問方式來進行服務(wù)、購物等一系列令人眼花繚亂的活動。
所有這些,我能說的是…關(guān)于時間。在多少年科技巨頭們都用非直觀的導航、讓人麻木的界面和夢魘般的下拉來接入他們的設(shè)備之后,他們終于采用了人類聲音的簡單性、優(yōu)雅和力量來達到相同的目的。(他們會持續(xù)多久,誰也說不準。但以后會更多。)
與此同時,在生活中,從播放我們最喜歡的曲子,到訂披薩,再到召喚優(yōu)步(Uber),一切都只是語音指令。
還有很多其他的功能即將問世,包括聲控電冰箱、洗衣機、真空吸塵器,當然還有汽車。市場研究公司IHS Markit表示,事實上,到2020年底,預計將有超過70億的消費者設(shè)備由語音激活的數(shù)字助理管理。
工程奇跡
當我們停下來思考人類的聲音有多顯著時,難怪蘋果、亞馬遜和微軟這樣的公司將其作為他們技術(shù)的門戶。也許唯一的問題是,是什么花了這么長時間?
我們的聲音是工程學的奇跡,代表著大腦、肺、喉、舌頭、上顎、臉頰和嘴唇之間復雜的相互作用。其結(jié)果是人類獨有的一種獨特的工具,它使人類文明進步了數(shù)萬年。
人類語言的錯綜復雜使我們與地球上其他生物相距甚遠。雖然我們傾向于把它看作是自然發(fā)展的東西,但我們能有效地、連貫地、有說服力地說話的能力實際上是在多年的傾聽、接觸和實踐中習得的。
使用語音來傳達思想、方向和命令,使得它成為當今訪問技術(shù)的高效工具。從某種意義上說,我們的聲音已經(jīng)成為了終極的免提裝置,我們不需要太多的努力。我們的大腦可以快速地將想法轉(zhuǎn)化成清晰的文字,然后將它們傳輸?shù)皆O(shè)備上,這就消除了瀏覽菜單、鍵入命令或用手指滑動屏幕的耗時、容易出錯的可能。
人類語言和技術(shù)發(fā)展之間的相互作用也使得今天的數(shù)字助理非常準確,盡管偶爾會出現(xiàn)一些有記錄的小故障。我的一位工程師朋友和語音識別專家說,最新一代助理的復雜算法和強大的處理能力使他們能夠通過高級學習和情景知識來填補空白。這意味著,他們通常能比人類更了解人類的說法。
我們該何去何從?
這是非常令人驚奇的事情,而且它也很好地解釋了為什么科技巨頭們會扎堆沖進語音設(shè)備領(lǐng)域。當然,如果僅僅幾十年的技術(shù)真的趕上了數(shù)百萬年的發(fā)展,我就想知道未來會是什么樣子。
我想知道這是否涉及到了我們聲音的本身。
也許下一代的技術(shù)--例如自動駕駛汽車--將完全繞過語音,直接進入我們的大腦,因此在我們能夠清晰地表達它們之前,我們就能夠理解指令。對我來說,這似乎有點可怕,但我確信,僅僅使用語音指令就能從互聯(lián)網(wǎng)上購買產(chǎn)品的想法,似乎在幾十年前就已經(jīng)過時了。
但我認為,這一切還需要幾年的時間。與此同時,讓我們愉快地使用最基本、最強大的人類能力--我們的聲音--來引導我們的生活。就像我之前說的,是時候了。
關(guān)于作者
Holger Reisinger
Holger Reisinger擁有奧地利薩爾茨堡大學應用科學和技術(shù)經(jīng)濟和信息管理碩士學位,超過21年從事IT和電信行業(yè)的經(jīng)驗,他是一個充滿激情和富有遠見的工作新方法方面的演講者。作為一名成功的IT&T高管,擁有成功的領(lǐng)導力、銷售、全球營銷和運營方面的經(jīng)驗,Holger Reisinger在過去的十年里一直致力于VoIP的業(yè)務(wù)發(fā)展。
聲明:版權(quán)所 有非合作媒體謝絕轉(zhuǎn)載