—.探針式BOSS業(yè)務(wù)監(jiān)控系統(tǒng)實(shí)戰(zhàn)分析
運(yùn)營(yíng)商當(dāng)前的業(yè)務(wù)運(yùn)營(yíng)支撐系統(tǒng)(BOSS)存在先天不足,既沒(méi)有能力感知BOSS系統(tǒng)的運(yùn)營(yíng)狀態(tài),也沒(méi)有能力預(yù)知故障的發(fā)生。3G時(shí)代,BOSS系統(tǒng)如何才能告別“無(wú)知”,先于用戶發(fā)現(xiàn)問(wèn)題,變被動(dòng)為主動(dòng),提高運(yùn)營(yíng)商業(yè)務(wù)質(zhì)量?
3G的正式運(yùn)營(yíng),帶來(lái)了國(guó)內(nèi)三大運(yùn)營(yíng)商(中國(guó)移動(dòng)、中國(guó)聯(lián)通、中國(guó)電信)之間白熱化的競(jìng)爭(zhēng)。用戶的持有量是各運(yùn)營(yíng)商實(shí)力的一個(gè)重要衡量指標(biāo),而網(wǎng)絡(luò)質(zhì)量和業(yè)務(wù)能力則決定著運(yùn)營(yíng)商能否持有較多用戶。對(duì)網(wǎng)絡(luò)質(zhì)量和業(yè)務(wù)能力的保障涉及到運(yùn)營(yíng)商內(nèi)部多個(gè)部門以及工作環(huán)節(jié),其中業(yè)務(wù)支撐是十分重要的一環(huán):業(yè)務(wù)運(yùn)營(yíng)支撐系統(tǒng)(BOSS)故障會(huì)導(dǎo)致?tīng)I(yíng)業(yè)廳關(guān)門、客戶投訴升級(jí)等重大問(wèn)題的發(fā)生,嚴(yán)重影響公司業(yè)務(wù)的正常運(yùn)營(yíng)。BOSS系統(tǒng)如何實(shí)現(xiàn)對(duì)業(yè)務(wù)能力的保障?如何使運(yùn)營(yíng)商業(yè)務(wù)支撐運(yùn)營(yíng)工作全面提升?
BOSS系統(tǒng)的先天不足
當(dāng)前運(yùn)營(yíng)商的BOSS系統(tǒng)普遍存在著先天不足:既沒(méi)有能力感知BOSS系統(tǒng)的運(yùn)營(yíng)狀態(tài),也沒(méi)有能力預(yù)知故障的發(fā)生。很多地方運(yùn)營(yíng)商的BOSS系統(tǒng)不同于傳統(tǒng)的電信設(shè)備系統(tǒng),并不具備電信級(jí)的能力標(biāo)準(zhǔn),而是附加了很多具有中國(guó)特色、甚至各省特色的IT系統(tǒng),在可靠性與可維護(hù)性上都與電信級(jí)產(chǎn)品相差甚遠(yuǎn)。這種先天不足主要體現(xiàn)在“可監(jiān)控性差”上。各個(gè)運(yùn)營(yíng)商都經(jīng)歷過(guò)或正在經(jīng)歷著被動(dòng)的BOSS維護(hù)模式三部曲:“客戶投訴—發(fā)現(xiàn)故障—故障修復(fù)”。
如何讓BOSS運(yùn)維人員能夠快速發(fā)現(xiàn)、有效解決業(yè)務(wù)問(wèn)題,全面了解業(yè)務(wù)運(yùn)營(yíng)系統(tǒng)的各種運(yùn)營(yíng)信息以及用戶的感知呢?
幾大運(yùn)營(yíng)商都在千方百計(jì)尋求自身BOSS業(yè)務(wù)支撐運(yùn)營(yíng)能力的提升。以中國(guó)移動(dòng)為例,中國(guó)移動(dòng)集團(tuán)公司曾經(jīng)下發(fā)過(guò)相關(guān)業(yè)務(wù)技術(shù)規(guī)范,多家省移動(dòng)公司都做過(guò)相關(guān)的嘗試。其中,上海移動(dòng)曾在BOSS系統(tǒng)改進(jìn)和提升方面取得了一定的突破,其具體方式是:直接在BOSS系統(tǒng)中增加維護(hù)代碼模式。這種做法的優(yōu)點(diǎn)是時(shí)效性強(qiáng),缺點(diǎn)是維護(hù)代碼與BOSS系統(tǒng)捆綁過(guò)于密切,難以實(shí)現(xiàn)大范圍普及。
BOSS也能實(shí)現(xiàn)監(jiān)控
中國(guó)移動(dòng)浙江公司在借鑒了上海移動(dòng)BOSS改進(jìn)模式的經(jīng)驗(yàn)之后,經(jīng)過(guò)為期二年的探索及驗(yàn)證,構(gòu)建了探針式BOSS業(yè)務(wù)監(jiān)控系統(tǒng)。探針式BOSS業(yè)務(wù)監(jiān)控系統(tǒng)提出了“以BOSS業(yè)務(wù)監(jiān)控為核心”的理念,采用“探針式提取、指標(biāo)引導(dǎo)、建模驅(qū)動(dòng)”的方式,打造一站式BOSS業(yè)務(wù)監(jiān)控系統(tǒng),既實(shí)現(xiàn)了對(duì)現(xiàn)有實(shí)際業(yè)務(wù)系統(tǒng)的有效監(jiān)控,也滿足了BOSS運(yùn)營(yíng)管理的需要。
探針式BOSS業(yè)務(wù)監(jiān)控系統(tǒng)由五層組成:數(shù)據(jù)采集層、業(yè)務(wù)建模層、數(shù)據(jù)聚集層、告警管控層、分析展示層。這五個(gè)不同的層次在運(yùn)營(yíng)商業(yè)務(wù)能力的提升和運(yùn)營(yíng)管理水平的提高上都起到了什么作用呢?
數(shù)據(jù)采集層: 是整個(gè)監(jiān)控系統(tǒng)的基礎(chǔ),用來(lái)提供核心的業(yè)務(wù)健康度建模和可用性建模所需要的平臺(tái)、應(yīng)用、業(yè)務(wù)等數(shù)據(jù)。
系統(tǒng)數(shù)據(jù)采集共采用了三類探針:A式探針直接模擬BOSS前臺(tái)業(yè)務(wù)操作,采集BOSS門戶各種業(yè)務(wù)應(yīng)用的可用狀態(tài); B式探針負(fù)責(zé)采集A式探針發(fā)起的前臺(tái)業(yè)務(wù)所觸發(fā)的BOSS后臺(tái)數(shù)據(jù)操作日志統(tǒng)計(jì)值,以及BOSS后臺(tái)系統(tǒng)運(yùn)營(yíng)狀態(tài),并將其發(fā)送業(yè)務(wù)監(jiān)控系統(tǒng); C式探針從BOSS接入交換機(jī)中全量采集BOSS交易記錄,即第一時(shí)間采集到實(shí)際BOSS運(yùn)營(yíng)的狀態(tài)。
綜上所述,這三類探針能夠獲取到從業(yè)務(wù)發(fā)起、業(yè)務(wù)處理、業(yè)務(wù)交易到業(yè)務(wù)完成全過(guò)程的用戶能夠感知到的所有業(yè)務(wù)數(shù)據(jù),為從用戶感知角度進(jìn)行業(yè)務(wù)監(jiān)控提供了堅(jiān)實(shí)的基礎(chǔ)。
業(yè)務(wù)建模層: 是整個(gè)監(jiān)控系統(tǒng)的核心,是將業(yè)務(wù)進(jìn)行有形化管理、量化衡量的高效手段。該業(yè)務(wù)建模層中涵蓋了幾乎所有的BOSS管理資源要素,包括業(yè)務(wù)、應(yīng)用、服務(wù)及其他平臺(tái)類資源,這些信息都建立并實(shí)時(shí)更新于企業(yè)集中建設(shè)的符合ITIL標(biāo)準(zhǔn)的CMDB(配置資源數(shù)據(jù)庫(kù),其中每一子項(xiàng)便是一個(gè)CI配置資源項(xiàng))中;贑MDB中動(dòng)態(tài)調(diào)整的實(shí)時(shí)CI項(xiàng)和相互關(guān)系,關(guān)聯(lián)上能夠反映業(yè)務(wù)當(dāng)前狀況的KPI指標(biāo),以結(jié)構(gòu)化的模型框架為指導(dǎo),建立完整的業(yè)務(wù)CI/KPI指標(biāo)體系,繪制出以業(yè)務(wù)為中心的BOSS系統(tǒng)視圖,全面展現(xiàn)其健康度和可用性。
CI/KPI指標(biāo)體系的建立是以業(yè)務(wù)為主線,按照“CI業(yè)務(wù)-應(yīng)用-平臺(tái)”的分層結(jié)構(gòu),針對(duì)每一層設(shè)定支撐域、運(yùn)營(yíng)域和服務(wù)域的指標(biāo)分類標(biāo)準(zhǔn),并在這些指標(biāo)的基礎(chǔ)上通過(guò)關(guān)系推導(dǎo)和加權(quán)計(jì)算創(chuàng)建業(yè)務(wù)健康度和可用性量化模型,將業(yè)務(wù)的層層嵌套、互相關(guān)聯(lián)與后臺(tái)軟硬件平臺(tái)之間的關(guān)系都量化出來(lái),并綜合為直觀有效的業(yè)務(wù)運(yùn)營(yíng)狀況指標(biāo); 作為監(jiān)控系統(tǒng)的核心,業(yè)務(wù)建模層為告警管控層的預(yù)警和故障定位提供了衡量基礎(chǔ)和分析邏輯,如果健康指標(biāo)超出經(jīng)驗(yàn)化閾值,業(yè)務(wù)預(yù)警可幫助維護(hù)人員將業(yè)務(wù)隱患消除于萌芽之中。
CI/KPI模型的建立,成功地將傳統(tǒng)監(jiān)控系統(tǒng)的監(jiān)控難點(diǎn)轉(zhuǎn)變?yōu)榱咙c(diǎn),通過(guò)對(duì)模型中父子業(yè)務(wù)間關(guān)系、業(yè)務(wù)與后臺(tái)資源間關(guān)系的結(jié)構(gòu)化梳理,多維度數(shù)據(jù)的采集計(jì)算,有效量化了業(yè)務(wù)健康度指標(biāo)。同時(shí),模型中所綜合的業(yè)務(wù)可用性、業(yè)務(wù)辦理量、后臺(tái)資源使用情況等全方位信息,尤為適合公司管理人員了解業(yè)務(wù)通體運(yùn)營(yíng)情況。
數(shù)據(jù)聚集層: 在這一層,系統(tǒng)將經(jīng)過(guò)CI/KPI模型、按不同業(yè)務(wù)規(guī)則結(jié)構(gòu)化之后的三類用戶體驗(yàn)數(shù)據(jù)進(jìn)行匯聚:業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)(業(yè)務(wù)可用性、業(yè)務(wù)量、業(yè)務(wù)辦理時(shí)長(zhǎng)、業(yè)務(wù)的后臺(tái)服務(wù)器負(fù)載情況等)、配置數(shù)據(jù)(從CMDB中定時(shí)同步配置項(xiàng)信息和配置關(guān)聯(lián)信息),業(yè)務(wù)感性數(shù)據(jù)(業(yè)務(wù)量、積壓量和投訴等信息),使得運(yùn)維人員不僅能夠從IT支撐視角掌握業(yè)務(wù)運(yùn)行狀況,還能直觀了解到在當(dāng)前業(yè)務(wù)運(yùn)行情況之下客戶層面的使用感知。
圖:探針式BOSS業(yè)務(wù)監(jiān)控系統(tǒng)架構(gòu)圖
圖: 采集層探針
告警管控層: 本層提供基于預(yù)警模型的預(yù)警管理和追根溯源的告警定位處理。
圖:業(yè)務(wù)三維立體分析展示
共 2 頁(yè):1 2
計(jì)算機(jī)世界報(bào)