“從騰訊來看,華為服務(wù)器的技術(shù)和服務(wù)優(yōu)勢非常明顯。首先華為服務(wù)器有很強的研發(fā)實力,全部是自研產(chǎn)品,能夠支撐騰訊的定制化需求在產(chǎn)品中快速實現(xiàn),并且產(chǎn)品可靠性很高;然后就是服務(wù)積極響應(yīng),硬件產(chǎn)品難免出故障,出現(xiàn)故障積極響應(yīng),快速處理,華為在這一點做的很好。”
---- 騰訊
客戶簡介
騰訊是亞洲最大、全球第三大互聯(lián)網(wǎng)企業(yè)(僅次于谷歌和亞馬遜)。騰訊是用戶最多的中國互聯(lián)網(wǎng)企業(yè),也是中國首家市值超1000億美元的互聯(lián)網(wǎng)公司。旗下分為游戲、社區(qū)、媒體、電商等6大業(yè)務(wù),各業(yè)務(wù)在中國互聯(lián)網(wǎng)均處于Top1~3的地位,在中國互聯(lián)網(wǎng)基本占據(jù)統(tǒng)治地位。
業(yè)務(wù)挑戰(zhàn)
為支撐龐大的互聯(lián)網(wǎng)業(yè)務(wù),騰訊現(xiàn)網(wǎng)的服務(wù)器總數(shù)已超過30萬臺,近年服務(wù)器采購量接近中國市場總量的10%。
騰訊每年電費支出超過10億人民幣,能耗成本是運營成本中很大的一部分,綠色節(jié)能成為服務(wù)器關(guān)注的重點之一。另外騰訊服務(wù)器很大一部分部署在運營商機房,運營商按機柜收費,機柜的租金也是運營成本中不小的投入。
服務(wù)器承載著騰訊的生產(chǎn)系統(tǒng),服務(wù)器停機會導致業(yè)務(wù)性能下降或暫停,造成巨大的直接和潛在收入損失,所以服務(wù)器穩(wěn)定性至關(guān)重要。
互聯(lián)網(wǎng)用戶需求是浪涌式,滿機柜20臺服務(wù)器的部署時間需要5小時以上,嚴重制約了業(yè)務(wù)的上線進度。由于業(yè)務(wù)快速發(fā)展及全業(yè)務(wù)運營的開展,騰訊各業(yè)務(wù)部門服務(wù)器規(guī)格不一,同一時間竟有28種規(guī)格配置,為選型測試、運維管理、采購預(yù)測提出了極大挑戰(zhàn),亟待優(yōu)化IT架構(gòu),并滿足未來業(yè)務(wù)平滑演進和靈活部署的要求。
解決方案
華為與騰訊自2008年在服務(wù)器領(lǐng)域展開全面合作,華為向騰訊提供了1U/2U機架服務(wù)器、刀片服務(wù)器、高密服務(wù)器、機柜服務(wù)器等全系列服務(wù)器產(chǎn)品。華為服務(wù)器從性能、能耗、部署等各項指標均很好的滿足甚至超越了騰訊的苛刻要求。
優(yōu)化設(shè)計、綠色節(jié)能
為降低服務(wù)器規(guī)模部署帶來的高功耗問題,華為與騰訊成立聯(lián)合創(chuàng)新團隊,獲取到幾年內(nèi)騰訊的詳細運維數(shù)據(jù),經(jīng)分析,服務(wù)器的平均利用率只有25%,其中Web接入服務(wù)器的利用率只有15%。為此,華為提出優(yōu)化方案:
1.使用更低能耗的Workstation CPU代替Server CPU,使得Web接入服務(wù)器功耗降低一半,部署密度提高一倍,整體運營成本降低25%。
2.由于服務(wù)器大部分擴展功能從未使用,剔除這部分特性后,功耗降低10%。
優(yōu)選部件、降低故障率
統(tǒng)計近兩年的故障維護數(shù)據(jù),發(fā)現(xiàn)服務(wù)器的故障率一直居高不下,詳細分析發(fā)現(xiàn)主要原因是復(fù)雜多樣的機型配置導致無法對每一種配置進行深度優(yōu)化。為此,在機型歸一化之初,聯(lián)合創(chuàng)新團隊就把嚴格控制故障率作為首要任務(wù),華為對容易發(fā)生故障的部件做詳細分析和深度優(yōu)化,優(yōu)選電信級部件,很好的控制了故障率,使得故障率降低了50%。
歸一化架構(gòu)、提高部署密度
自2008年起,華為與騰訊的聯(lián)合團隊詳細分析討論了現(xiàn)有28種配置的差異和共性,在最大化滿足業(yè)務(wù)個性需求的前提下,突出共性特征,將配置從將28種歸一化到5種,極大的優(yōu)化了機型配置,使得服務(wù)器選型測試部、運維部和采購部的工作量大幅降低,工作內(nèi)容更加聚焦,同時使得服務(wù)器的故障率大幅降低。同時,聯(lián)合創(chuàng)新團隊充分考慮IT架構(gòu)的靈活性和未來的平滑演進性,從1U、2U服務(wù)器歸一化到2U機箱、多種節(jié)點,再到后續(xù)的機柜服務(wù)器,所有節(jié)點平滑演進,多種不同配置的節(jié)點共用機箱、電源系統(tǒng)和接口,保持技術(shù)的延續(xù)性,同時保護用戶投資。
一體化交付、簡化管理
以往客戶每種配置機箱不統(tǒng)一,機房無法提前布線,服務(wù)器到貨安裝時才能對機柜進行布線,部署效率極低。經(jīng)過優(yōu)化,將所有機型歸一化到2U機箱,不同配置使用不同的節(jié)點,機柜布線在機房建設(shè)時即可提前部署,服務(wù)器到貨安裝時只需要插好電源、網(wǎng)線,部署效率大幅提高。傳統(tǒng)服務(wù)器大多是前后維護,故障燈在前面,而多數(shù)接口在后面,對于成百上千個機柜、數(shù)千臺服務(wù)器的大機房,這種后維護方式帶來效率極低,甚至實際中發(fā)生多次搞錯機器的情況。為此,華為服務(wù)器支持前維護功能,特別是X6000服務(wù)器,所有節(jié)點操作均是前維護,給日常維護工作帶來極大便利。
客戶收益
截至2013年底,超過10萬臺華為服務(wù)器部署在騰訊現(xiàn)網(wǎng)業(yè)務(wù)中,成為騰訊最大的服務(wù)器供應(yīng)商。華為服務(wù)器不僅滿足了騰訊當前的建設(shè)需求,而且也很好的適應(yīng)了后續(xù)的業(yè)務(wù)發(fā)展需要。
1.成本節(jié)省過億:高密度部署節(jié)省機房空間50%,功耗減低15%,每年成本節(jié)省過億元
2.最低的故障率:電信級部件、優(yōu)秀設(shè)計和制造工藝,有效解決了批次性故障問題,華為服務(wù)器在騰訊的統(tǒng)計中故障率最低
3.部署、管理效率大幅提升:滿機柜20臺服務(wù)器的部署時間由原先5小時降低到現(xiàn)在10分鐘; 故障自動發(fā)現(xiàn)和自動上報,帶來運維的極大方便。
回首整個項目運作歷程以及華為服務(wù)器在實際運行中的良好表現(xiàn),騰訊對此評價道:
“從騰訊來看,華為服務(wù)器的技術(shù)和服務(wù)優(yōu)勢非常明顯。首先華為服務(wù)器有很強的研發(fā)實力,全部是自研產(chǎn)品,能夠支撐騰訊的定制化需求在產(chǎn)品中快速實現(xiàn),并且產(chǎn)品可靠性很高;然后就是服務(wù)積極響應(yīng),硬件產(chǎn)品難免出故障,出現(xiàn)故障積極響應(yīng),快速處理,華為在這一點做的很好。”