24周年

財(cái)稅實(shí)務(wù) 高薪就業(yè) 學(xué)歷教育
APP下載
APP下載新用戶掃碼下載
立享專屬優(yōu)惠
安卓版本:8.7.11 蘋果版本:8.7.11
開(kāi)發(fā)者:北京正保會(huì)計(jì)科技有限公司
應(yīng)用涉及權(quán)限:查看權(quán)限>
APP隱私政策:查看政策>

企業(yè)運(yùn)維系統(tǒng)建立初探

來(lái)源: 編輯: 2008/08/09 11:06:02  字體:

  一、背景說(shuō)明

  隨著IT技術(shù)在企業(yè)的應(yīng)用,許多企業(yè)已經(jīng)建立了核心業(yè)務(wù)系統(tǒng),如ERP、OA、數(shù)據(jù)倉(cāng)庫(kù)等,業(yè)務(wù)策略驅(qū)動(dòng)IT策略的建立,IT策略支持業(yè)務(wù)策略,由此,許多企業(yè)的運(yùn)作已經(jīng)離不開(kāi)IT系統(tǒng)了,因此任何一個(gè)故障造成的損失,影響面是比較大,甚至影響整個(gè)企業(yè)的業(yè)務(wù)。而傳統(tǒng)的運(yùn)行維護(hù)管理模式比較被動(dòng), 即只有當(dāng)系統(tǒng)出問(wèn)題時(shí), 才會(huì)引起注意和得到解決, 或者當(dāng)業(yè)務(wù)受影響, 并被業(yè)務(wù)部門匯報(bào)投訴,才發(fā)現(xiàn)問(wèn)題。 這種管理模式已經(jīng)不能適應(yīng)目前環(huán)境下業(yè)務(wù)的需求。

  其次,從生命周期的角度看,無(wú)論是硬件還是軟件,大致可分為規(guī)劃和設(shè)計(jì)、開(kāi)發(fā)和測(cè)試、實(shí)施、運(yùn)營(yíng)和終止等5個(gè)階段。前面3階段從時(shí)間的角度看,只占生命周期的20%,其余80%的時(shí)間基本上是運(yùn)維服務(wù),如果整個(gè)IT的運(yùn)維做得不好,那么這些花費(fèi)大筆投資建立起來(lái)的系統(tǒng),無(wú)法帶來(lái)預(yù)期的效益,甚至于無(wú)法使用,因?yàn)槭褂谜邿o(wú)法順利使用他們。

  根據(jù)Gartner Group調(diào)查發(fā)現(xiàn),在經(jīng)常出現(xiàn)的問(wèn)題中,源自技術(shù)和產(chǎn)品方面的其實(shí)只占了20%,流程失誤占40%,人員疏失占40%。流程失誤包括變更管理沒(méi)有做好、超載、沒(méi)有測(cè)試等流程上的失誤或不完整,人員疏失包括遺忘、訓(xùn)練不足、備份錯(cuò)誤及安全疏忽等。這就說(shuō)明IT運(yùn)維方面的問(wèn)題,更多的不是技術(shù)問(wèn)題,而是來(lái)自管理方面,因此對(duì)IT系統(tǒng)需要一套管理系統(tǒng)來(lái)支撐,這就是運(yùn)行維護(hù)系統(tǒng)。

  二、信息系統(tǒng)運(yùn)行維護(hù)面臨的挑戰(zhàn)

  一般信息系統(tǒng)架構(gòu)的層次如下:

  由此,我們可以看到,為了保證應(yīng)用系統(tǒng)的可用性,不但要保證應(yīng)用程序本身的正確性和健壯性,同時(shí)還要保證從網(wǎng)絡(luò)到應(yīng)用程序端到端的可用性,為此,從運(yùn)行維護(hù)的角度來(lái)看,必須從整體的角度來(lái)規(guī)劃,對(duì)與應(yīng)用系統(tǒng)相關(guān)的IT基礎(chǔ)設(shè)施、支撐平臺(tái)進(jìn)行集中監(jiān)控,并與應(yīng)用系統(tǒng)進(jìn)行關(guān)聯(lián),一旦出現(xiàn)故障,可以迅速定位并解決;同時(shí)定義相關(guān)的流程保證一個(gè)應(yīng)用的變更不會(huì)對(duì)其他應(yīng)用產(chǎn)生影響,對(duì)出現(xiàn)的問(wèn)題從根源上找出原因,并進(jìn)行解決,從而保證系統(tǒng)的高可用性。基于本人對(duì)IT服務(wù)管理的理解,基于ITIL的框架,提出運(yùn)行維護(hù)系統(tǒng)建立的一些想法。

  三、運(yùn)行維護(hù)系統(tǒng)的設(shè)計(jì)

  那么如何設(shè)計(jì)IT運(yùn)行維護(hù)系統(tǒng)呢?主要從兩方面著手,一是管理流程的設(shè)計(jì),二是系統(tǒng)監(jiān)控的設(shè)計(jì)。在管理流程方面,目前ITIL(IT Infrastruct Library)基本上成為事實(shí)上的標(biāo)準(zhǔn),它是最佳實(shí)踐的結(jié)晶;在系統(tǒng)監(jiān)控方面包括從IT基礎(chǔ)設(shè)施應(yīng)用系統(tǒng)進(jìn)行監(jiān)控,并實(shí)現(xiàn)事件的關(guān)聯(lián),以實(shí)現(xiàn)主動(dòng)的監(jiān)控,實(shí)現(xiàn)故障的快速定位和預(yù)警,下面具體說(shuō)明。

 ?。ㄒ唬┻\(yùn)維系統(tǒng)的設(shè)計(jì)理念運(yùn)維系統(tǒng)的設(shè)計(jì)理念基于ITIL-IT服務(wù)管理框架,ITIL 將IT 服務(wù)管理分為:

  ●信息和通信基礎(chǔ)框架管理,這部份將更側(cè)重于技術(shù)視角。

  ●服務(wù)管理,包括“提供IT 服務(wù)” 和“支持IT ”服務(wù)兩部分,關(guān)注在提供IT 服務(wù)過(guò)程中,監(jiān)控,管理,處理解決問(wèn)題的整個(gè)過(guò)程。

  ●面向業(yè)務(wù)的管理,將從業(yè)務(wù)的視角來(lái)看管理,將管理IT 服務(wù)與IT 服務(wù)所支撐的業(yè)務(wù)關(guān)聯(lián)。

  1. 信息和通信基礎(chǔ)

  框架管理IT 基礎(chǔ)框架的智能管理是服務(wù)保障的基礎(chǔ),應(yīng)該是一個(gè)可以全面管理IT 基礎(chǔ)框架中所有產(chǎn)品和技術(shù)的平臺(tái),并通過(guò)提供以下能力達(dá)到真正的業(yè)務(wù)價(jià)值、真正的投資回報(bào)、保障安全生產(chǎn),提高服務(wù)水平。

  IT 基礎(chǔ)框架的智能管理將覆蓋企業(yè)IT環(huán)境,提供包括廣域網(wǎng),局域網(wǎng),主機(jī)接入網(wǎng)絡(luò),網(wǎng)絡(luò)安全設(shè)備,Internet 服務(wù)的全方位的IT 從網(wǎng)絡(luò)到系統(tǒng),應(yīng)用,業(yè)務(wù)的監(jiān)控管理,以及面向IT運(yùn)維的事件壓縮,事件相關(guān)性分析,故障診斷,根源故障分析,自動(dòng)化的故障處理等一系列功能和工具。

  2. 服務(wù)管理今天,正進(jìn)行著服務(wù)

  管理的革命。幾乎所有企業(yè)的IT 部門都正在向面向業(yè)務(wù)的服務(wù)提供者的轉(zhuǎn)變。IT部門就像一個(gè)合作伙伴一樣參與到企業(yè)的業(yè)務(wù)過(guò)程,主動(dòng)的提供服務(wù)職能,并向它的客戶-業(yè)務(wù)部門負(fù)責(zé)。

  ITIL 將企業(yè)的IT 服務(wù)管理分為:

  提供IT服務(wù),關(guān)注在提供IT 服務(wù)過(guò)程中和管理行為和手段;

  支持IT 服務(wù), 關(guān)注在支持IT 服務(wù)過(guò)程中,處理問(wèn)題,變更等的動(dòng)作和流程。

  (1)提供IT 服務(wù)提供IT 服務(wù)包括:制定規(guī)劃,為業(yè)務(wù)部門按計(jì)劃和服務(wù)質(zhì)量提供服務(wù)保障提供服務(wù)的持續(xù)性。

  在服務(wù)提供體系實(shí)現(xiàn)的主要任務(wù)是:

  ■服務(wù)水平管理

  ■可用性管理

  ■容量管理

  ■成本管理

  ■應(yīng)急方案

  (2)支持IT 服務(wù)支持IT 服務(wù)包括:為達(dá)到服務(wù)目標(biāo)提供相關(guān)管理信息。為實(shí)現(xiàn)服務(wù)目標(biāo)提供相應(yīng)的支撐機(jī)制。

  服務(wù)支持體系實(shí)現(xiàn)的主要任務(wù)是:

  ■配置管理

  ■幫助臺(tái)管理

  ■問(wèn)題管理

  ■變更管理

  ■軟件控制和分發(fā)管理

  3. 面向業(yè)務(wù)的管理面向業(yè)務(wù)的IT 管理是從客戶視角的端到端服務(wù)監(jiān)控管理,它的特點(diǎn)是:

  提供直觀的監(jiān)控視圖,能夠?qū)崟r(shí)判斷通信和IT 基礎(chǔ)框架故障對(duì)業(yè)務(wù)的影響;

  在發(fā)生影響業(yè)務(wù)的故障時(shí),IT服務(wù)保障部門能夠最快的獲知問(wèn)題的發(fā)生,并迅速采取行動(dòng);

  根據(jù)故障對(duì)業(yè)務(wù)的影響情況,決定處理的優(yōu)先級(jí);

  當(dāng)業(yè)務(wù)服務(wù)發(fā)生問(wèn)題時(shí)能夠確定故障所在的基礎(chǔ)框架層次;

  通知相關(guān)客戶服務(wù)系統(tǒng)或大客戶,告知問(wèn)題的狀況和解決進(jìn)展;

  面向客戶業(yè)務(wù)服務(wù),提供基于Web 的多種視圖,包括端到端服務(wù)監(jiān)控層次模型,和監(jiān)控構(gòu)成服務(wù)系統(tǒng)的各個(gè)組件;

  面向業(yè)務(wù)管理的宗旨是通過(guò)全面的業(yè)務(wù)系統(tǒng)和IT 框架系統(tǒng)監(jiān)控,增強(qiáng)管理,提高管理水平,并最終保障業(yè)務(wù)的成功運(yùn)行。實(shí)現(xiàn)IT基礎(chǔ)框架端到端的監(jiān)控和與業(yè)務(wù)的關(guān)聯(lián)。

  (二)運(yùn)維系統(tǒng)的設(shè)計(jì)目標(biāo)●確保IT流程支撐業(yè)務(wù)流程, 整體提高業(yè)務(wù)運(yùn)營(yíng)的質(zhì)量。

  ●提高用戶的滿意度, 提升企業(yè)的社會(huì)效益和經(jīng)濟(jì)效益。

  ●實(shí)時(shí)實(shí)現(xiàn)對(duì)從IT的基礎(chǔ)架構(gòu)到應(yīng)用系統(tǒng)的端到端的運(yùn)行情況進(jìn)行監(jiān)控。

  ●提供從業(yè)務(wù)角度分析IT基礎(chǔ)設(shè)施(包括系統(tǒng)、網(wǎng)絡(luò)、數(shù)據(jù)庫(kù)、應(yīng)用服務(wù)器)的能力。

  ●建立完善的支持服務(wù)流程和支持模式。

  ●建立滿足服務(wù)水平要求的服務(wù)水平管理。

 ?。ㄈ┗贗TIL的理念建立規(guī)范的處理流程在ITIL中要建立許多管理流程,在實(shí)際應(yīng)用中,我覺(jué)得至少需要建立下面幾個(gè)流程:

 ?。?)問(wèn)題管理建立并應(yīng)用問(wèn)題處理程序,以實(shí)現(xiàn)對(duì)問(wèn)題診斷和確定解決問(wèn)題的方案, 并將解決方案記錄在配置數(shù)據(jù)庫(kù)中,針對(duì)服務(wù)水平管理確定并實(shí)現(xiàn)內(nèi)部的問(wèn)題升級(jí)時(shí)間標(biāo)準(zhǔn)。

 ?。?)資產(chǎn)管理對(duì)于每天發(fā)生的事件, 問(wèn)題, 變更處理, 新服務(wù)的配置, 各個(gè)組件的信息,資產(chǎn)管理的職責(zé)就是提供和維護(hù)這些信息, 它是與服務(wù)管理相關(guān)的最重要的任務(wù)之一。

  (3)Help Desk管理?yè)?dān)當(dāng)服務(wù)中與業(yè)務(wù)部門和客戶的主要接觸點(diǎn)(point-of-contac)。存儲(chǔ)事件, 確定問(wèn)題嚴(yán)重級(jí)別, 綜合支持團(tuán)隊(duì)的努力, 確保及時(shí)準(zhǔn)確地解決問(wèn)題, 并提供SLA統(tǒng)計(jì), 證明能夠達(dá)到預(yù)期的服務(wù)級(jí)別。

 ?。?)變更管理保證清楚的了解變更針對(duì)一個(gè)服務(wù)中任何組件的影響, 并保證對(duì)服務(wù)水平的影響最小, 變更管理包括SLA文檔和服務(wù)目錄的變更, 以及組織變更和針對(duì)軟件和硬件的變更。

 ?。?)故障管理故障管理的主要目標(biāo)是盡可能快地恢復(fù)服務(wù)至服務(wù)級(jí)別協(xié)議(SLA)要求的水準(zhǔn),盡可能減少故障對(duì)服務(wù)運(yùn)營(yíng)的不利影響,以確保最好的服務(wù)質(zhì)量和可用性級(jí)別。

  (四)運(yùn)維系統(tǒng)的組成在一般的運(yùn)維系統(tǒng)中,需要一個(gè)大房間,在大房間中分成以下幾個(gè)部分,每個(gè)部分都扮演相應(yīng)的角色:

  第一層:大屏幕分別顯示有,基于業(yè)務(wù)的視圖,基于IT基礎(chǔ)架構(gòu)的視圖,基于網(wǎng)絡(luò)的視圖,當(dāng)故障出現(xiàn)時(shí)能夠以特定的顏色顯示出來(lái),同時(shí)可以顯示一些公司需要直觀顯示的數(shù)據(jù)。

  第二層:服務(wù)臺(tái)(Help Desk),主要提供:

  ●接受客戶的請(qǐng)求

  ●提供客戶使用上的問(wèn)題咨詢

  ●提供客戶業(yè)務(wù)咨詢

  ●記錄并跟蹤故障和客戶意見(jiàn)

  ●根據(jù)知識(shí)庫(kù),盡快解決問(wèn)題

  ●及時(shí)通知客戶其請(qǐng)求的當(dāng)前狀況和最新進(jìn)展

  ●根據(jù)服務(wù)級(jí)別協(xié)議,初步評(píng)估請(qǐng)求,經(jīng)歷解決它們或安排給一線工程師解決

  ●對(duì)客戶的故障從提出到驗(yàn)證及終止的整個(gè)過(guò)程進(jìn)行管理

  ●協(xié)調(diào)一線工程師和值班工程師第三層:一線支持工程師

  ●根據(jù)提供的監(jiān)控界面迅速定位問(wèn)題并解決

  ●對(duì)于臨時(shí)的解決辦法,還要把故障提交給問(wèn)題處理流程

  ●根據(jù)服務(wù)級(jí)別,在問(wèn)題未能及時(shí)解決時(shí)及時(shí)把問(wèn)題提交給值班經(jīng)理第四層:值班經(jīng)理個(gè)人

  ●協(xié)調(diào)技術(shù)專家,根據(jù)服務(wù)協(xié)議的時(shí)間要求,解決問(wèn)題

  ●協(xié)調(diào)供應(yīng)商,根據(jù)維護(hù)協(xié)議要求,解決問(wèn)題

 ?。ㄎ澹┻\(yùn)維系統(tǒng)的功能設(shè)計(jì)基于ITIL設(shè)計(jì)理念,我們把ECC的實(shí)時(shí)監(jiān)控部分設(shè)計(jì)成層次架構(gòu),如下圖:

  1. 事件采集層

  在最基本的層次上,需要從被管理的IT基礎(chǔ)設(shè)施中獲取廣泛的,實(shí)時(shí)的數(shù)據(jù),能夠從網(wǎng)絡(luò)、系統(tǒng)和應(yīng)用層中捕獲、匯聚并處理大量數(shù)據(jù)的能力,我們通常稱之為事件管理。

  事件管理是整個(gè)面向服務(wù)管理系統(tǒng)的核心,在數(shù)據(jù)采集階段(包括網(wǎng)絡(luò)、系統(tǒng)和應(yīng)用層)采集的信息,只有經(jīng)過(guò)事件管理服務(wù)器,轉(zhuǎn)變?yōu)榻y(tǒng)一的格式,再流入智能化的管理層,實(shí)現(xiàn)事件的相關(guān)性分析。

  數(shù)據(jù)采集層是整個(gè)管理系統(tǒng)進(jìn)行信息處理和智能化分析的基礎(chǔ),因此需要充分獲得準(zhǔn)確、實(shí)時(shí)、完整的管理數(shù)據(jù)。在數(shù)據(jù)采集層,應(yīng)該進(jìn)行原始數(shù)據(jù)的過(guò)濾、分類、分級(jí)等預(yù)處理操作,從中提煉出重要的管理信息。數(shù)據(jù)采集層獲取信息的實(shí)時(shí)和準(zhǔn)確性,以及對(duì)原始信息的預(yù)處理能力,將在很大程度上影響整個(gè)管理系統(tǒng)的管理能力和效率。

  2.事件處理層

  數(shù)據(jù)收集僅僅是實(shí)現(xiàn)業(yè)務(wù)和通信及IT基礎(chǔ)框架管理的基礎(chǔ),需求最簡(jiǎn)單的先決條件。實(shí)現(xiàn)真正的基礎(chǔ)框架智能化意味著能夠從整個(gè)基礎(chǔ)框架產(chǎn)生的大量數(shù)據(jù)中,通過(guò)采用一系列先進(jìn)的過(guò)濾,事件壓縮,關(guān)聯(lián)和診斷的技術(shù)進(jìn)行處理,抽取管理人員需要關(guān)注的重要信息。好的基礎(chǔ)框架監(jiān)控管理系統(tǒng)能夠?qū)⒕W(wǎng)絡(luò)以至IT系統(tǒng)的專業(yè)化知識(shí)融入在管理系統(tǒng)中,根據(jù)基礎(chǔ)框架層各組成資源的特點(diǎn),從原始的管理數(shù)據(jù)中智能分析系統(tǒng)的真實(shí)狀況,判斷資源實(shí)際的運(yùn)行狀態(tài),分析故障發(fā)生的根源并提出解決建議,使運(yùn)維人員解決問(wèn)題更加準(zhǔn)確和有效。一般包含以下功能:

  (1)事件的存儲(chǔ)將運(yùn)行維護(hù)數(shù)據(jù)與歷史數(shù)據(jù)分開(kāi)存儲(chǔ), 以確保管理的效率。 一般管理信息需要保留6個(gè)月甚至更長(zhǎng)的數(shù)據(jù), 以進(jìn)行統(tǒng)計(jì)分析和存檔, 而在日常運(yùn)行管理中, 一般只需要查看最近一周甚至更短的信息, 一般采用運(yùn)行數(shù)據(jù)與實(shí)時(shí)數(shù)據(jù)分開(kāi)存儲(chǔ), 運(yùn)行數(shù)據(jù)采用高速的內(nèi)存數(shù)據(jù)庫(kù)保證事件處理的實(shí)時(shí)性, 歷史數(shù)據(jù)采用穩(wěn)定的關(guān)系型數(shù)據(jù)庫(kù)保證事件存儲(chǔ)的可靠性和容量,這種結(jié)構(gòu)使事件的處理更加合理。

 ?。?)事件壓縮IT資源事件中有很多重復(fù)事件, 尤其在系統(tǒng)組件不穩(wěn)定時(shí), 有可能會(huì)產(chǎn)生事件風(fēng)暴。過(guò)多的事件會(huì)使管理員的桌面上羅列大量事件條目,管理員無(wú)法獲取真正需要關(guān)注的重要事件,因此對(duì)重復(fù)事件進(jìn)行合并使事件條目清晰, 幫助管理員快速找到需要處理的故障是非常重要的。重復(fù)事件壓縮就是這樣的一個(gè)過(guò)程: 通過(guò)將從下層數(shù)據(jù)源所報(bào)告的相似事件加以匯總,合并成一條事件,該事件的內(nèi)容包含了該事件重復(fù)的次數(shù)以及發(fā)生的起止時(shí)間。

 ?。?)事件自動(dòng)化處理可以對(duì)各類事件信息進(jìn)行邏輯判斷, 并做出相應(yīng)的動(dòng)作, 如及時(shí)刪除不必要的信息、完成不同事件之間的關(guān)聯(lián)、對(duì)嚴(yán)重事件采用明顯的聲音報(bào)警、自動(dòng)升級(jí)警告級(jí)別如果嚴(yán)重事件在一段時(shí)間內(nèi)沒(méi)有人響應(yīng)、發(fā)送郵件進(jìn)行自動(dòng)通知等等。

  (4)可用性的計(jì)算方法根據(jù)故障樹分析FTA(Fault Tree Analysis)方法,結(jié)合可用性的計(jì)算方法,來(lái)計(jì)算服務(wù)的可用性。

  組件可用率的計(jì)算方法:組件可用率 = (AST-DT)/AST*100% AST——約定服務(wù)時(shí)間(Agreed service time)

  DT——在約定時(shí)間內(nèi)的實(shí)際停機(jī)時(shí)間(Actual downtime)

  (5)可用性的評(píng)估指標(biāo)通常我們采用下面幾個(gè)指標(biāo)來(lái)對(duì)可用性進(jìn)行評(píng)估:

 ?、倨骄鶡o(wú)故障時(shí)間(MTBF-Mean Time Between Falures),它指的是從某次事故修復(fù)到下次事故發(fā)生之間的平均間隔時(shí)間,又稱為正常運(yùn)營(yíng)時(shí)間(Uptime),它是用來(lái)描述服務(wù)的可靠性。

 ?、谄骄迯?fù)時(shí)間(MTTR-Mean Time To Repair),它指的是事故發(fā)生到服務(wù)恢復(fù)之間的平均間隔時(shí)間,又稱為停機(jī)時(shí)間(Downtime),它是用來(lái)描述服務(wù)的可維護(hù)性和適用性。

  3.業(yè)務(wù)關(guān)聯(lián)層業(yè)務(wù)影響分析, 基于CFIA等分析法,定義事件和業(yè)務(wù)系統(tǒng)的關(guān)聯(lián)關(guān)系, 自動(dòng)找到故障所影響的業(yè)務(wù)和服務(wù), 并根據(jù)關(guān)聯(lián)結(jié)果創(chuàng)建新的服務(wù)事件報(bào)警。

  4.呈現(xiàn)層提供基于Web方式的監(jiān)控視圖, 可以為不同的管理人員提供不同的監(jiān)控窗口, 以實(shí)時(shí)監(jiān)控相關(guān)的事件信息, 事件窗口可以通過(guò)分組顯示不同類型、級(jí)別、源、時(shí)間段內(nèi)的事件信息, 管理員可以一目了然的看到目前是否有事件發(fā)生, 級(jí)別如何, 并對(duì)事件進(jìn)行一系列的處理工作。

  5.報(bào)表處理層各種監(jiān)控信息存儲(chǔ)在關(guān)系數(shù)據(jù)庫(kù)中,可以利用報(bào)表工具進(jìn)行信息統(tǒng)計(jì)分析,生成各種格式的報(bào)表。

  報(bào)表應(yīng)用可以與實(shí)時(shí)故障監(jiān)視環(huán)境實(shí)現(xiàn)無(wú)縫集成,為運(yùn)維提供一種長(zhǎng)期的綜合視圖。報(bào)表應(yīng)用幫助管理人員了解其各種基礎(chǔ)設(shè)施在各種不同期間的行為特點(diǎn),從不同設(shè)備、系統(tǒng)和服務(wù)的層次上對(duì)各種基礎(chǔ)架構(gòu)的長(zhǎng)期行為特點(diǎn)進(jìn)行查看和分析。

 ?。┻\(yùn)維系統(tǒng)的設(shè)計(jì)要求

  1.基于ITIL框架設(shè)計(jì), 結(jié)構(gòu)先進(jìn)運(yùn)維系統(tǒng)的設(shè)計(jì)要求基于ITIL的框架, ITIL的框架是最佳實(shí)踐的結(jié)晶。

  2.可擴(kuò)展性如果需要一個(gè)新的展示層或者事件關(guān)聯(lián),必須能夠無(wú)縫擴(kuò)充或集成到現(xiàn)有的管理框架中。為了保證隨著系統(tǒng)架構(gòu)的延伸擴(kuò)展而產(chǎn)生的越來(lái)越多的事件信息的處理性能,在任意一個(gè)層次增加都不會(huì)影響整體框架結(jié)構(gòu)。

  3.集成性集成企業(yè)現(xiàn)有以及未來(lái)可能要擴(kuò)充的設(shè)備和管理系統(tǒng)。如果需要增加新的監(jiān)控對(duì)象,則最多只需簡(jiǎn)單地增加一個(gè)探針,或增加一個(gè)新的關(guān)聯(lián)層 .

   4.集中化已經(jīng)處理的事件(重復(fù)壓縮和事件關(guān)聯(lián))集中在一個(gè)地方。因此管理員可以共享整個(gè)系統(tǒng)的事件信息。

  5.關(guān)聯(lián)因?yàn)槭录P(guān)聯(lián)功能在整個(gè)系統(tǒng)管理中是分布的,因此為一個(gè)新服務(wù)增加新的事件關(guān)聯(lián)是非常容易的。

  6.冗余數(shù)據(jù)顯示層和關(guān)聯(lián)層的設(shè)計(jì)將考慮冗余設(shè)計(jì),當(dāng)任何一個(gè)服務(wù)器失敗,數(shù)據(jù)采集層的探針將會(huì)自動(dòng)切換到另一個(gè)服務(wù)器。

  綜上所述,運(yùn)維系統(tǒng)的設(shè)計(jì),主要從兩個(gè)方面來(lái)實(shí)現(xiàn),一是管理流程的設(shè)計(jì),二是系統(tǒng)監(jiān)控的設(shè)計(jì),通過(guò)上面的描述,我們看到,系統(tǒng)監(jiān)控的作用:當(dāng)系統(tǒng)出現(xiàn)故障時(shí)通過(guò)對(duì)系統(tǒng)各個(gè)層面的監(jiān)控以及事件的關(guān)聯(lián),能夠保證快速定位故障,從而快速解決故障,使得故障對(duì)業(yè)務(wù)的影響降到最小,同時(shí)通過(guò)對(duì)系統(tǒng)性能的監(jiān)控,進(jìn)行預(yù)警,可以做到防范于未然,防范故障于萌芽狀態(tài),保證系統(tǒng)的可用性;而規(guī)范的管理流程,保證所有的問(wèn)題在每一個(gè)階段得到有效的處理

回到頂部
折疊
網(wǎng)站地圖

Copyright © 2000 - www.odtgfuq.cn All Rights Reserved. 北京正保會(huì)計(jì)科技有限公司 版權(quán)所有

京B2-20200959 京ICP備20012371號(hào)-7 出版物經(jīng)營(yíng)許可證 京公網(wǎng)安備 11010802044457號(hào)