從今天開始,我們帶你認(rèn)識一群不同的程序員。
他們是來自騰訊云背后的技術(shù)大咖。他們熱愛技術(shù),用“匠人”精神在工作中不斷闖關(guān)升級。讓我們在新欄目“大咖訪談錄”里一起分享他們的故事和經(jīng)歷吧。
“以前每個(gè)周末都去跑跑步、打打球,現(xiàn)在回家就是接接小孩,隨著年齡的增長,很多愛好都丟了。”
沙開波——騰訊云計(jì)算產(chǎn)品總監(jiān),從一名基礎(chǔ)架構(gòu)組的程序員,到如今的計(jì)算產(chǎn)品總監(jiān),這已是他在騰訊的第9個(gè)年頭。
在騰訊云內(nèi)部,他是著名的大規(guī)模調(diào)度系統(tǒng)VStation的技術(shù)負(fù)責(zé)人,同事們喜歡稱他“老沙”。
VStation是騰訊云自主研發(fā)的革命性虛擬化平臺,承載了CVM 后臺整體集群管理與系統(tǒng)調(diào)度。VStation為騰訊云 CVM 業(yè)務(wù)的爆發(fā)式增長提供了堅(jiān)實(shí)的技術(shù)基礎(chǔ),目前,單集群可以調(diào)度10萬臺計(jì)算機(jī)。
時(shí)間回到2009年,初入騰訊的沙開波,就職于騰訊B2(Business2)研發(fā)部的基礎(chǔ)架構(gòu)組,也就是大家熟知的QQ空間、QQ會員、Q鉆等業(yè)務(wù)基礎(chǔ)架構(gòu)組。沙開波表示:“2009年5月份來到騰訊,那個(gè)時(shí)候還沒有騰訊云這個(gè)業(yè)務(wù)。”
“我還是比較偏技術(shù)的,自己對技術(shù)這塊也比較感興趣,當(dāng)一個(gè)技術(shù)難點(diǎn)被解決后,成就感會瞬間爆表,我覺得每個(gè)做技術(shù)的應(yīng)該都有這樣的感覺。”
從2009年對云嘗試,到2011年正式投入,再到2013年正式開放,最后到今天的成果,沙開波是騰訊云成長的見證人,而伴隨騰訊云逐漸走向成熟,沙開波也逐漸從技術(shù)走向了管理。
他的角色發(fā)生了改變,將更大的精力放在業(yè)務(wù)規(guī)劃、整體技術(shù)架構(gòu)以及人才梯隊(duì)建設(shè)等上面。“雖然現(xiàn)在已經(jīng)很少寫代碼,但是我并不擔(dān)心淘汰或者落伍,最起碼,現(xiàn)在同事問我一些技術(shù)層面問題,我還能解決,”老沙笑著說。
1、5千節(jié)點(diǎn)是一道坎10萬節(jié)點(diǎn)的技術(shù)難度可想而知
從技術(shù)轉(zhuǎn)向管理,沙開波并不認(rèn)為這是他技術(shù)人生的轉(zhuǎn)折點(diǎn)。然而,當(dāng)一個(gè)“吹毛求疵”的“技術(shù)宅”走上管理崗,會擦出什么樣的火花?騰訊云分布式調(diào)度系統(tǒng)VStation的成績足以說明。
“我們研究了國內(nèi)外主要的大規(guī)模調(diào)度系統(tǒng),不要說單集群10萬,就是幾千節(jié)點(diǎn),一般的調(diào)度系統(tǒng)都很容易出現(xiàn)問題。”
大家熟悉的OpenStack項(xiàng)目就是如此。要管理10萬級別的計(jì)算機(jī)這樣大規(guī)模的調(diào)度系統(tǒng),國內(nèi)外沒有任何已有的系統(tǒng)和資料可以參考。對于騰訊云來說,只有從零開始,而且要做就做到最好。
技術(shù)上,5千節(jié)點(diǎn)是一道大的門檻, 業(yè)界知名的Google、Amazon云平臺都遇到過大規(guī)模停機(jī)的事情,很多問題你是無法預(yù)料到的。只有經(jīng)歷大規(guī)模部署,有些問題才會出現(xiàn),所以背后的技術(shù)難度可想而知。
“從開始決定做這個(gè)系統(tǒng)之后,我們就從各個(gè)技術(shù)小組抽調(diào)了10來個(gè)人,聯(lián)合攻堅(jiān)。前后1-2個(gè)月時(shí)間,就把系統(tǒng)做出來了,這個(gè)系統(tǒng)背后的每一條代碼都是我們自己從無到有開發(fā)出來的。”沙開波介紹說。
“我的個(gè)性是這樣的,只要有一個(gè)事情放在那個(gè)地方?jīng)]有解決的話,就會白天想、晚上想。”按照沙開波的描述,出身技術(shù)的他本身就是一個(gè)技術(shù)狂,或者說是工作狂。通常情況下,一個(gè)任務(wù)布置下來,兩個(gè)星期交付都沒有問題,但沙開波卻一定要盡可能兩天把它做出來,然后留更多的時(shí)間去完善。
2、“我們的目標(biāo)是5秒創(chuàng)建虛擬機(jī)”
騰訊云分布式調(diào)度系統(tǒng)VStation通過消息壓縮、鏡像緩存、快照回滾等系列優(yōu)化實(shí)踐,實(shí)現(xiàn)了生產(chǎn)吞吐率從數(shù)百臺 /分鐘到數(shù)萬臺 /分鐘、平均創(chuàng)建時(shí)間由 300秒下降到 30秒以下的驚人蛻變。
在談到VStation升級問題時(shí),沙開波非常興奮,并表示騰訊云內(nèi)部的目標(biāo)“希望虛擬機(jī)在5秒到10秒之間就可以創(chuàng)建出來,并希望通過軟硬結(jié)合的方式,降低虛擬化帶來性能損耗的問題。”
從30秒降到10秒以內(nèi),對于技術(shù)來說又是一次質(zhì)的飛躍。沙開波深知,這個(gè)計(jì)劃如果完成,對于整個(gè)騰訊云技術(shù)來說,將是又一次洗禮,但是這個(gè)沒有退路。
創(chuàng)建速度快,意味著用戶體驗(yàn)更好。站在用戶的立場,如果能夠快速的幫助企業(yè)創(chuàng)建出來,這不僅僅是時(shí)間的問題,更多的是對用戶業(yè)務(wù)上的幫助。“我們在團(tuán)隊(duì)里一直強(qiáng)調(diào),我們做彈性計(jì)算,首先計(jì)算要能彈,能快速地去交付給用戶,如果創(chuàng)建一個(gè)機(jī)器需要幾分鐘,一個(gè)小時(shí)才能拿到的話,這不叫云計(jì)算!”
關(guān)于創(chuàng)建速度的問題,沙開波直言不諱:“從目前來看,我們的創(chuàng)建速度非常有競爭力,即便和國內(nèi)外更早布局云計(jì)算的公有云廠商對比,我們也有足夠的自信。”
另外,云計(jì)算最開始考慮的是如何把計(jì)算或網(wǎng)絡(luò)跟物理機(jī)解耦,其中虛擬化技術(shù)起到了關(guān)鍵的作用。但不可否認(rèn),云變成一個(gè)基礎(chǔ)設(shè)施的時(shí)候,虛擬化雖占盡優(yōu)勢,但卻增加了性能上的損耗,其中包括網(wǎng)絡(luò)、存儲等等。
而在采訪中,沙開波也表示這也是騰訊云所關(guān)注的問題。“我們正在做一些軟硬結(jié)合的工作,來降低虛擬化帶來性能損耗的問題,不論是網(wǎng)絡(luò)還是存儲,我們最終目標(biāo)還是彈性的計(jì)算,希望用戶可以按需獲得媲美物理計(jì)算資源的彈性云計(jì)算資源。”
3、用戶是最好的“裁判員”,“靠近”才能明晰方向
在沙開波的眼中,用戶才是最好的“裁判員”,所有的技術(shù)升級和突破,歸根結(jié)底就是要讓技術(shù)普惠化,讓技術(shù)為人所用。
不可否認(rèn)的一條市場定律,“需求才是生產(chǎn)力”。或許正是沙開波想法的詮釋。據(jù)了解,騰訊云產(chǎn)品的優(yōu)先級是基于客戶的需求來的,很多產(chǎn)品和技術(shù)都是來自于客戶實(shí)際的想法以及真實(shí)的訴求。
沙開波也正在帶領(lǐng)團(tuán)隊(duì)走近用戶。“今年從上到下希望離用戶更近一點(diǎn),也多跟客戶去聊,了解客戶的訴求和需求”。他透露這是2018年重點(diǎn)要去改變的方向。
正如沙開波口中“裁判員”的說法,一個(gè)產(chǎn)品團(tuán)隊(duì)產(chǎn)品做得好和不好,客戶的評價(jià)往往是最中肯、實(shí)用的。在談及工作中遇到的問題、以及如何解決問題的時(shí)候,沙開波描述了他們解決問題的思路。
“先去幫助客戶去解決問題,虛心接受客戶的吐槽,之后再優(yōu)化產(chǎn)品。”
以這樣的工作理念,沙開波在騰訊已經(jīng)走過了9年的時(shí)間。目前,在沙開波眼中騰訊云還在不斷“闖關(guān)升級”,但可以肯定的是,未來在千萬個(gè)具備匠人精神的“沙開波”努力下,騰訊云將會更茁壯,為用戶帶來更多的價(jià)值。