以色列公司Voicesense向客戶提供了一個(gè)有趣的承諾:給我們一個(gè)人的聲音,我們會(huì)告訴你他聲音背后的很多秘密。這家公司在個(gè)人通話期間使用實(shí)時(shí)語(yǔ)音分析技術(shù),可以評(píng)估其銀行貸款是否可能違約,能否購(gòu)買(mǎi)更昂貴的產(chǎn)品,或者成為最佳的工作伴侶。
據(jù)外媒報(bào)道,聲音數(shù)據(jù)非常個(gè)人化,很難偽造,并且包含了有關(guān)人類心理健康和行為的令人驚訝的信息。
有不少公司和研究人員,正在利用人的語(yǔ)音數(shù)據(jù),得到人的更多的信息,用于健康監(jiān)測(cè)、精神狀態(tài)分析、金融服務(wù)推銷、客戶服務(wù)等。人們不得不驚嘆語(yǔ)音帶給人們工作、生活帶來(lái)的便利,同時(shí)語(yǔ)音技術(shù)有可能正在一些方面侵害個(gè)人隱私,影響大家享受公正公平社會(huì)服務(wù)。
一、正在大量被收集的個(gè)人聲音數(shù)據(jù)
“現(xiàn)在有大量的設(shè)備可以捕捉個(gè)人的語(yǔ)音,無(wú)論是你的手機(jī),還是像Alexa和Google Home這樣的東西。”,麻省理工學(xué)院麥戈文腦研究中心的研究科學(xué)家Satrajit Ghosh說(shuō),F(xiàn)在有很多的公司和機(jī)構(gòu)有興趣為心理健康目的開(kāi)發(fā)語(yǔ)音分析,聲音在生活中變得無(wú)處不在。
根據(jù)商業(yè)分析公司IdTechEx的報(bào)告,語(yǔ)音技術(shù)市場(chǎng)正在迅速增長(zhǎng),預(yù)計(jì)到2029年將達(dá)到155億美元。
近年來(lái),研究人員和初創(chuàng)公司已經(jīng)注意到可以從語(yǔ)音中挖掘出豐富的信息,尤其是像亞馬遜的Alexa這樣的家庭助理的普及,人們?cè)诩抑信cAlexa交談,數(shù)字語(yǔ)音助理越來(lái)越多地用于醫(yī)院,使得消費(fèi)者越來(lái)越習(xí)慣于與這些設(shè)備交談。
Alexa是一款完全基于語(yǔ)音指令驅(qū)動(dòng),無(wú)需屏幕的AI語(yǔ)音助理軟件,于2015年8月正式向第三方開(kāi)放。此前,Alexa一直默默無(wú)聞地充當(dāng)著亞馬遜另一款產(chǎn)品——智能語(yǔ)音音箱Echo的幕后功臣,為其創(chuàng)造了上市兩年累計(jì)銷量超過(guò)550萬(wàn)臺(tái)的成績(jī)。
根據(jù)數(shù)據(jù)統(tǒng)計(jì),搭載Alexa的硬件品類已經(jīng)超過(guò)7000種。產(chǎn)品品類從電器、手機(jī)到機(jī)器人、汽車(chē)信息娛樂(lè)系統(tǒng),品牌涵蓋了LG、華為、GE、福特、大眾、聯(lián)想、優(yōu)必選等多個(gè)領(lǐng)域。半年的時(shí)間內(nèi),亞馬遜讓Alexa平臺(tái)的接入數(shù)量增長(zhǎng)了6000家。分析師Mark Mahaney預(yù)計(jì),在最近的假日季亞馬遜賣(mài)出了1000萬(wàn)臺(tái)Alexa設(shè)備。
谷歌的智能家居產(chǎn)品——Google Home,注重于音樂(lè)娛樂(lè)和語(yǔ)音搜索的硬件產(chǎn)品。它內(nèi)置了處理系統(tǒng)以及谷歌助理,相比蘋(píng)果的Siri和微軟Cortana,Google Home不僅僅進(jìn)行語(yǔ)音交互,并透過(guò)機(jī)器學(xué)習(xí)與人工智能的結(jié)合,使其轉(zhuǎn)變成為為智能家居控制中心,或者也可以稱之為智能管家。
二、如何從聲音數(shù)據(jù)探究信息?
聲音不僅無(wú)處不在;它非常個(gè)人化,很難假裝,并且出現(xiàn)在我們最私密的環(huán)境中。
據(jù)國(guó)外媒體報(bào)道,語(yǔ)音分析研究的關(guān)鍵是個(gè)人如何說(shuō):音調(diào)、速度、重點(diǎn)和停頓等,核心是機(jī)器學(xué)習(xí)。技術(shù)人員從兩組中挑選標(biāo)記樣本,例如,焦慮的人與沒(méi)有的人,并將數(shù)據(jù)提供給算法。然后,該算法學(xué)會(huì)獲取可能表明某人是否屬于A組或B組的微妙說(shuō)話符號(hào),并且可以在將來(lái)對(duì)新樣本執(zhí)行相同操作。
卡耐基梅隆大學(xué)(CMU)計(jì)算機(jī)科學(xué)家Louis-Philippe Morency表示,分析結(jié)果有時(shí)可能違反直覺(jué)。他建立了一個(gè)名為SimSensei的項(xiàng)目,可以幫助人們用語(yǔ)音檢測(cè)抑郁癥。在一些試圖將聲音特征與再次嘗試自殺的可能性相匹配的早期研究中,Morency的研究小組發(fā)現(xiàn),聲音柔和、氣喘的人,而不是那些有緊張或憤怒聲音的人,更有可能再次嘗試自殺。然而,這項(xiàng)研究是初步的。
盡管如此,研究人員已經(jīng)建立了使用聲音來(lái)幫助識(shí)別從帕金森病到創(chuàng)傷后應(yīng)激障礙的所有算法。對(duì)于許多人來(lái)說(shuō),這項(xiàng)技術(shù)的最大承諾在于語(yǔ)音分析和心理健康的交叉,并希望創(chuàng)建一種簡(jiǎn)單的方法來(lái)監(jiān)控和幫助那些有復(fù)發(fā)風(fēng)險(xiǎn)的人。
Companion Mx是一種精神健康監(jiān)測(cè)系統(tǒng),目前僅適用于醫(yī)生和患者;颊呤褂迷搼(yīng)用程序記錄音頻日記。該程序分析這些日記以及呼叫日志和位置等元數(shù)據(jù),以確定患者狀況,通過(guò)評(píng)價(jià)四個(gè)因素——抑郁情緒、興趣減少、躲避和疲勞,與患者共享,并在儀表板中提供給希望密切關(guān)注患者行為的醫(yī)生。該公司已經(jīng)對(duì)該產(chǎn)品進(jìn)行了7年的測(cè)試,并且有超過(guò)1500名患者。結(jié)果表明,該技術(shù)可以預(yù)測(cè)抑郁癥和創(chuàng)傷后應(yīng)激障礙的癥狀,但需要進(jìn)一步驗(yàn)證。
同時(shí),Voicesense、CallMiner、RankMiner等服務(wù)和Companion Mx的母公司Cogito承諾在業(yè)務(wù)環(huán)境中使用語(yǔ)音分析。大多數(shù)時(shí)候,這意味著改善呼叫中心的客戶服務(wù)參與度。Voicesense有更大的夢(mèng)想:貸款違約預(yù)測(cè),保險(xiǎn)索賠預(yù)測(cè),揭示客戶的投資風(fēng)格,人力資源的內(nèi)部候選人評(píng)估,評(píng)估員工是否可能離開(kāi)等,并可以提供關(guān)于健康行為、工作行為、娛樂(lè)等的預(yù)測(cè)。
Voicesense語(yǔ)音處理算法每秒測(cè)量200多個(gè)參數(shù),并且可以在許多不同的語(yǔ)言上準(zhǔn)確實(shí)現(xiàn),包括像中國(guó)的普通話這樣的語(yǔ)言。該計(jì)劃仍處于試點(diǎn)階段,但該公司與大型銀行以及其他投資者保持聯(lián)系。“每個(gè)人都對(duì)這種技術(shù)的潛力著迷。”
三、你的聲音也是一種數(shù)字資產(chǎn)
到目前為止,但很少有人考慮到,我們的聲音作為另一種形式的數(shù)據(jù),可以告訴我們自己和別人很多信息。所有這些都導(dǎo)致了關(guān)于這些信息如何被利用,以及如何使用和保護(hù)個(gè)人隱私的問(wèn)題。
德雷塞爾大學(xué)(Drexel University)的犯罪學(xué)教授Robert D'Ovidio擔(dān)心,Voicesense設(shè)想的一些應(yīng)用可能具有歧視性。想象一下,他打電話給一家抵押貸款公司,并且他們用你的聲音來(lái)確定你患心臟病的風(fēng)險(xiǎn)更高,然后你被認(rèn)為風(fēng)險(xiǎn)更高。“我真的認(rèn)為,制定消費(fèi)者保護(hù)立法,以防止收集這些。”
華盛頓大學(xué)法學(xué)院教授瑞安·卡洛指出,存在這樣的一些消費(fèi)者保護(hù)措施。語(yǔ)音被認(rèn)為是一種生物識(shí)別措施,而美國(guó)的一些州已經(jīng)制定了保證生物識(shí)別安全的法律。與種族或性別等敏感類別信息相關(guān)的偏見(jiàn)問(wèn)題是機(jī)器學(xué)習(xí)技術(shù)的特有問(wèn)題,無(wú)論這些技術(shù)是用于語(yǔ)音分析還是查看簡(jiǎn)歷,當(dāng)這些機(jī)器學(xué)習(xí)方法用于面部或語(yǔ)音識(shí)別時(shí),人們會(huì)感到內(nèi)心不安,部分原因是這些特征是如此個(gè)性化。雖然存在反歧視法律,但圍繞語(yǔ)音分析的問(wèn)題涉及更廣泛,即何時(shí)可以使用信息以及什么構(gòu)成歧視,這是我們作為一個(gè)社會(huì)沒(méi)有充分努力解決的概念。
很多專家認(rèn)為,未來(lái)發(fā)展中,數(shù)據(jù),無(wú)論采用何種形式,都是一種資產(chǎn);在數(shù)據(jù)采集應(yīng)用中,針對(duì)大批量數(shù)量應(yīng)用,數(shù)據(jù)就像在電子表格或聲紋中輸入的一堆數(shù)字一樣,沒(méi)有特殊的含義,即脫敏;在針對(duì)個(gè)人時(shí),隱私應(yīng)該得到保護(hù),至少,在使用個(gè)人數(shù)據(jù)時(shí)應(yīng)該即時(shí)得到通知。