這幾天最有趣的消息莫過于Uber相關(guān)關(guān)鍵字被微信屏蔽的事。騰訊的回應說“系統(tǒng)抖動”造成的這次屏蔽,結(jié)果引起了更多爭議,有人表示相信,有人表示不信。馮大輝在小道消息里面說他相信這個解釋,而我,則是半信半疑,我相信這件事一定有技術(shù)因素,但我同樣相信背后有非技術(shù)因素影響,故為半信。
虎嗅有一篇文章大概是從百度百科抄來一個“系統(tǒng)抖動”定義,那個解釋跟這件事完全沒關(guān)系。所以,我們先猜測下系統(tǒng)抖動到底是什么,會造成什么影響。
在互聯(lián)網(wǎng)以及計算機行業(yè),系統(tǒng)抖動本來也不是一個嚴謹?shù)墓こ堂~,不同的系統(tǒng)設計和架構(gòu),會出現(xiàn)完全不同的狀況。如果非要概括一下,微信所指的應該是指因為分布式系統(tǒng)數(shù)據(jù)同步的差異,從而造成的系統(tǒng)表現(xiàn)出來的不一致狀態(tài)。中國用戶比較容易體會到類似的系統(tǒng)抖動,大概有兩個案例,其一是所謂的Google Dance,就是在Google上時而搜不到一個網(wǎng)站,過幾天又可以搜到了。這是因為Google在更新巨大的網(wǎng)頁索引庫的時候,不同節(jié)點的索引版本不一樣,導致排序算法暫時混亂。而過了一段時間,數(shù)據(jù)同步了,自然也就好了。如果你從來沒注意過這件事,可能是因為在中國一會能訪問Google,一會又不能訪問。這就是其二,偉大的GFW系統(tǒng)封網(wǎng)站的時候出現(xiàn)了類似問題,大多數(shù)情況下會封掉Google,但某些時候因為數(shù)據(jù)同步和更新的問題,又導致Google被解封,用戶就感覺偶爾能訪問一下,但大部分時間不行。
這兩個例子說明這類技術(shù)問題確實很常見,最終用戶也很容易會感知到它的存在。但這種技術(shù)問題的特征應該是偶然發(fā)生,持續(xù)時間不長,并且分布平均。比如Google Dance不可能只針對一個網(wǎng)站出現(xiàn),而是機會平均被各種網(wǎng)站遇到,如果每次都是騰訊域名下所以頁面都搜索不到,那就不是系統(tǒng)抖動了。而GFW抖動造成被封網(wǎng)站突然能用,也不僅僅限于Google,其他網(wǎng)站,比如Facebook、Twitter也時而會出現(xiàn)突然能訪問的狀況,如果這些都不熟悉,順便說一聲,著名的1024網(wǎng)今天突然能訪問了…按照這個特征對照一下Uber遇到的情況,就會覺得這不是常規(guī)意義的“系統(tǒng)抖動“。
我自己寫不少Uber相關(guān)的文章,對Uber非常關(guān)注,微信上也有不少在Uber工作的朋友。時而會遇到他們說自己的官方帳號不能訪問了,或者貼個圖問大家能不能看到。對Uber的屏蔽一直是逐步升級的,而且也確實持續(xù)了三個月。系統(tǒng)如何抖動,和架構(gòu)設計和原理有很大關(guān)系,但既然叫做抖動了,它必須得是在抖才合理。想想抖動這個詞在現(xiàn)實世界本來的含義是什么?抖,應該是忽然向上、忽然向下,一會兒正常、一會兒不正常,這樣才叫抖。Uber是持續(xù)遇到問題,一邊倒,這怎么能叫做抖呢?我覺得叫做“系統(tǒng)傾翻”更符合這種一邊倒情況。
微信的反垃圾攔截系統(tǒng)具體設計和算法不得而知,但所有反垃圾系統(tǒng)使用的數(shù)學方法萬變不離其宗。它肯定是一種基于概率的過濾器算法。我并不打算在這解釋數(shù)學原理,霍金說:“一本書中多一個數(shù)學公式就會減少一半讀者”,所以我就一個公式也不寫,只解釋一下大致原理。以比較常用的貝葉斯過濾器當例子,貝葉斯概率是從一個主觀假設開始,通過逐漸補充的數(shù)據(jù)計算來修正最初假設的過程。在這個過程中,主觀假設是可以隨便設置的,比如:假設公眾帳號發(fā)表的文章中,有30%是違反規(guī)則的垃圾文章。然后用事實去修正它。所謂修正,就是持續(xù)告訴系統(tǒng)這一篇不是垃圾,那一篇是垃圾的過程。在這個模式里面,最早的猜想叫做先驗概率,通過一系列的事實修正,最終得到的結(jié)果叫做后驗概率,后驗概率就可以用來判斷一篇文章是不是違規(guī)了。實際應用系統(tǒng)會比這個復雜的多,但原理應該差不多,總是根據(jù)一個假設和事實修正逐漸接近事實情況的優(yōu)化過程。在這個過程中,四處是可以調(diào)整的參數(shù),并且會直接影響最終效果。在這類系統(tǒng)中,如果不是專門為Uber調(diào)整了某些參數(shù),我實在沒法從技術(shù)角度理解這種所謂的系統(tǒng)抖動是如何發(fā)生的。
退一步說,就算真是系統(tǒng)自發(fā)的錯誤行為,相關(guān)團隊也應該早就應該通過優(yōu)化的方式解決這一問題,而不至于等到大眾媒體都開始關(guān)注才發(fā)現(xiàn)。就說誘導分享這件事,整個微信世界還有比滴滴紅包更頻繁,更廣泛的誘導分享嗎?恐怕找不出第二個案例來。但滴滴這樣做就是沒事,這如果也不是人工優(yōu)化參數(shù)的結(jié)果,我只能認為騰訊已經(jīng)孕育出了超越人類智能的人工智能了。據(jù)Uber的官方說明,他們此前已經(jīng)多次和騰訊聯(lián)系試圖解決問題,結(jié)果就是解決不了。另外一方面,Uber中國團隊也有不少曾經(jīng)在騰訊工作過的人。無論是私下渠道還是公開渠道,騰訊應該都不會是這幾天才知道這件事存在吧。這些情況放在一起,就更不是單一技術(shù)問題能夠解釋的。
另外,我時而會舉報一些確實是”誘導分享“的文章,以試圖測試微信的行為模式。不過到目前為止無一成功,都被系統(tǒng)回復了舉報失敗?梢娺@個誘導分享的判斷門檻并不低,對比前一段常見的Uber相關(guān)文章被“多人舉報”的情況,我不禁對這位”多人“同學非常佩服,一舉報一個準。我時而感嘆世界上最強大的情報機關(guān)中,中國擁有兩個,一個是”多人“,一個是”朝陽群眾“。
我的“半信半疑“的半疑就來源于此。到現(xiàn)在為止,技術(shù)上的解釋沒法讓我相信。當然了,技術(shù)上的解釋合理不合理并不重要,從阿里到騰訊,技術(shù)在關(guān)鍵時刻總是被拿出來“獨擋一面“,重要的是將來會怎么樣。
所以所謂半信,除了相信存在一些技術(shù)因素,即,確實和算法有一些關(guān)系,而不是直接屏蔽一個關(guān)鍵詞之外。我更愿意相信微信把事情做好的愿望。在中國普遍的職權(quán)不分的情況下,微信能回應此事,并且確實在解決,已經(jīng)不容易了。對于未來我就保持一個半信的態(tài)度。對于大企業(yè)內(nèi)部利益的平衡方式,是中國企業(yè)和美國企業(yè)最大的區(qū)別,當然也可以認為是中國社會和美國社會最大的區(qū)別。每次大家說起來Google的某些團隊竟然要招聘SEO(搜索引擎優(yōu)化)人員,就覺得是個笑話,但這恰恰說明了Google內(nèi)部有防火墻,可以隔絕各部門利益。這是成為一個公平平臺的關(guān)鍵。這種公平,正是平臺型公司獲得信賴的關(guān)鍵。在中國,恐怕還沒有哪家互聯(lián)網(wǎng)公司能做好這件事。
另外,這件事由Uber引發(fā)并不奇怪。Uber是罕見的大規(guī)模沖擊現(xiàn)實世界的公司,在之前,互聯(lián)網(wǎng)公司里面只有電商企業(yè)真正沖擊了現(xiàn)實世界。別說騰訊這樣一家企業(yè),就算是各國政府不也正在Uber引發(fā)的浪潮中顛三倒四,做出各種怪事來嗎?
這里在順便說一個這幾天發(fā)生的好玩事。此前我寫過我們這個加拿大城市發(fā)生的Uber和市政府對抗的故事(文末有鏈接),最近這故事又有了新升級。本市出租車聯(lián)盟主席責怪市長,說應該讓警方來按照《安省高速法案》嚴格執(zhí)法,打擊Uber。我們的市長竟然真的致電警方,要求警方嚴格執(zhí)法。對于一個三權(quán)分立的國家,這簡直是天大的笑話。市民簡直被震驚了,人們紛紛評論說市長你是Peace offer,有什么權(quán)利去要求Police Offer按照你的要求執(zhí)法?果不其然,幾天之后警方發(fā)言人得體的回復:“夏天是我們最忙的時候,我們最重要的職責是保護市民安全,打擊犯罪,保證交通暢通,其他不重要事務暫時沒人手專門處理。”一個三權(quán)分立了上百年的國家,其首都都被攪和到這樣顛三倒四,恨不得和中國一樣設立政法委組織聯(lián)合辦公,騰訊做為一家公司稍微有點混亂也不算什么奇怪的事。
對于Uber這樣一家公司,并不需要給予他們特別的同情,只要給他們不要太不公平的環(huán)境即可。必須要說,微信在維護秩序和尊重用戶方面,做的已經(jīng)比其他中國互聯(lián)網(wǎng)公司好很多了,希望如這樣的抖動只是偶然現(xiàn)象。畢竟,用戶還是需要Uber的,這是強大而真實的需求,任何阻力都很難阻擋它。順便求不要把這篇文章也抖沒了…