蘋果的Siri語音助理也被爆料,一直在悄悄保存用戶錄音,并讓承包商對這些錄音進(jìn)行分析。
蘋果已秘密加入谷歌亞馬遜行列,使用承包商對其用戶錄音進(jìn)行分析。在一名舉報(bào)人將錄音帶到英國《衛(wèi)報(bào)》(The Guardian)后,蘋果證實(shí)了這一做法。這人說,Siri查詢會(huì)定期發(fā)送給人類聽眾進(jìn)行更細(xì)致的分析,但蘋果在其隱私政策中并未披露。
據(jù)報(bào)導(dǎo),這些錄音與蘋果身份認(rèn)證(Apple ID)無關(guān),但可長達(dá)數(shù)秒,包含個(gè)人性質(zhì)的內(nèi)容,并與其它顯示資料如方位、應(yīng)用程序資料和聯(lián)絡(luò)人詳細(xì)資訊配對。
與其它公司一樣,蘋果說這些資料由真人搜集并分析,以改進(jìn)其服務(wù),且所有分析均由受保密協(xié)定約束的員工在安全設(shè)施中完成。而蘋果也沒有自動(dòng)承認(rèn)這一做法。
蘋果告訴《衛(wèi)報(bào)》,每天發(fā)送的查詢不到1%,但當(dāng)蘋果于無意之間不斷談?wù)揝iri查詢數(shù)量時(shí),談到數(shù)以億計(jì)的設(shè)備也經(jīng)常使用該功能,1%則激增為成千上萬了。
正如舉報(bào)人指出的,Siri錄音中包括:醫(yī)生和患者之間的私人交談、商業(yè)交易、好像是罪犯之間的交易、性接觸等。
Siri的某些錄音是出于偶然,這是為什么需要培訓(xùn)才能收聽并識別的原因之一。意外錄音有時(shí)長達(dá)數(shù)秒,且包含大量個(gè)人資訊,即便不與數(shù)位識別碼直接綁定。
語音助理要想「掌握」一門語言,需要解決兩個(gè)問題:聲音識別和聲音合成。其中聲音識別是對機(jī)器輸入資訊,又分為兩步,分別是:第一步,將語音轉(zhuǎn)成文字的語音識別;第二步,語義理解,這里就需要用到自然語言處理技術(shù)。
但就目前而言,就算各家宣傳把語音助理、智能音箱吹噓得功能強(qiáng)大,它們依然只是初級人工智能。想讓機(jī)器聽懂人類語言,并準(zhǔn)確「聰明」回應(yīng),依然需要大量人工介入。
蘋果并不是第一家被爆語音助理對話錄音會(huì)被其他人聽到的科技公司,當(dāng)然也不會(huì)是最后一家。
今年4月,彭博社消息顯示,亞馬遜(Amazon)在全球雇用了數(shù)千名合同工,他們會(huì)聽到某些來自Echo智能音箱的使用者語音請求,并負(fù)責(zé)注釋標(biāo)記這些轉(zhuǎn)錄語音,以提高Alexa識別人類語言的能力。
7月11日,谷歌(Google)證實(shí)于全球各地聘請承包商員工收聽一小部分錄音,并表示搜集的部分音檔用于開發(fā)語音識別系統(tǒng),以更適應(yīng)各種語言,提升使用者體驗(yàn)。