一级片www_中文在线二区_HD中文字幕在线播放,三级视频日韩,扒开老师双腿猛进入喷水免费观看 ,怡红院直播

如何應(yīng)對(duì)容器和微服務(wù)帶來(lái)的IT監(jiān)控挑戰(zhàn)
2020-10-10 by uino 10.0K 技術(shù)分享

IT監(jiān)控作為IT的伴生系統(tǒng),應(yīng)對(duì)了各種IT技術(shù)發(fā)展帶來(lái)的挑戰(zhàn),然而在容器和微服務(wù)的時(shí)代到來(lái)之際,IT監(jiān)控會(huì)面臨哪些挑戰(zhàn)?又應(yīng)該如何應(yīng)對(duì)呢?

一、IT監(jiān)控的現(xiàn)狀

01.規(guī)模增大,IT系統(tǒng)越發(fā)復(fù)雜

現(xiàn)在企業(yè)的IT環(huán)境早已不是少量幾臺(tái)服務(wù)器就可以支撐的,各企業(yè)IT團(tuán)隊(duì)都需要應(yīng)對(duì)各種IT復(fù)雜的環(huán)境:物理機(jī)、虛擬機(jī)、IAAS、PASS、各種應(yīng)用等。而近兩年微服務(wù)和容器等技術(shù)的發(fā)展,讓基礎(chǔ)設(shè)施的管理對(duì)象越來(lái)越多,也越來(lái)越分散;同時(shí)敏捷迭代的思維,上層的應(yīng)用程序發(fā)布節(jié)奏也更加頻繁。當(dāng)這些因素疊加在一起,就造成了企業(yè)IT監(jiān)控的數(shù)據(jù)量以指數(shù)級(jí)的增加,以至于遠(yuǎn)遠(yuǎn)超出了“人類”的處理能力。

02.精細(xì)化“全棧”監(jiān)控時(shí)代已經(jīng)到來(lái)

為了應(yīng)對(duì)現(xiàn)代IT系統(tǒng)的復(fù)雜性,絕大多數(shù)企業(yè)已經(jīng)放棄傳統(tǒng)“一刀切”的單維監(jiān)控方案,轉(zhuǎn)而投向立體分散的“全棧”監(jiān)控方法。如今IT系統(tǒng)的監(jiān)控平均要使用大約6-8個(gè)工具,其中至少包括:系統(tǒng)監(jiān)控、用戶行為監(jiān)控、APM、錯(cuò)誤檢測(cè)、日志分析、網(wǎng)絡(luò)監(jiān)控、ITSM工單系統(tǒng)。因?yàn)楦鞣N工具相互割裂缺乏有效的整合,工程師需要不斷地對(duì)各種屏幕和儀表板進(jìn)行操作。

二、IT監(jiān)控需要面對(duì)的挑戰(zhàn)

01.告警風(fēng)暴頻發(fā)

不斷增加的工具數(shù)量與所需要處理的龐大數(shù)據(jù)相結(jié)合后,必然出現(xiàn)海量告警數(shù)據(jù),從而導(dǎo)致告警風(fēng)暴問(wèn)題。每當(dāng)發(fā)生故障時(shí),IT團(tuán)隊(duì)都被來(lái)自多個(gè)監(jiān)控工具的告警所淹沒(méi),但卻沒(méi)有任何關(guān)于整體問(wèn)題的歸納。這樣不僅難以快速檢測(cè)和分類問(wèn)題,而且還阻礙IT團(tuán)隊(duì)發(fā)現(xiàn)可能更為嚴(yán)重的問(wèn)題。

02. 運(yùn)維壁壘顯現(xiàn)

運(yùn)維部門(mén)常會(huì)碰到以下場(chǎng)景:核心業(yè)務(wù)系統(tǒng)不能正常訪問(wèn),大家都不知道問(wèn)題出在哪,只能將各領(lǐng)域人員召集到一起分析。各管理員往往有自己獨(dú)立的監(jiān)控平臺(tái),大家各自為政分頭檢查,沒(méi)有人能知道完整的總體情況,導(dǎo)致系統(tǒng)的恢復(fù)時(shí)間較長(zhǎng),給企業(yè)帶來(lái)負(fù)面影響。監(jiān)控?cái)?shù)據(jù)層面,各領(lǐng)域監(jiān)控?cái)?shù)據(jù)割離,不能集中分析和展現(xiàn),無(wú)法深入挖掘運(yùn)維價(jià)值。怎么第一時(shí)間全面掌握IT各領(lǐng)域系統(tǒng)運(yùn)行狀況,及時(shí)發(fā)現(xiàn)系統(tǒng)隱患和問(wèn)題?

03. 事件處理低效

業(yè)務(wù)對(duì)IT運(yùn)維精細(xì)化要求越來(lái)越高,精細(xì)化的運(yùn)維必然要求對(duì)海量運(yùn)維數(shù)據(jù)的實(shí)時(shí)深入分析,這樣也就帶來(lái)了大量的數(shù)據(jù)采集,從不同維度對(duì)管理對(duì)象進(jìn)行監(jiān)控,從而產(chǎn)生大量的事件數(shù)據(jù)。在有限的人力情況下,如何高效的采集、存儲(chǔ)、分析處理和展現(xiàn)大量事件數(shù)據(jù)?并且避免傳統(tǒng)集中監(jiān)控平臺(tái)在事件量太大造成告警延遲和丟失問(wèn)題。

三、新一代IT監(jiān)控的能力需求

01.監(jiān)控事件的匯聚與處理

  1. **事件匯總:**匯總不同層級(jí)、不同專業(yè)、不同類型的事件是集中監(jiān)控的基礎(chǔ),無(wú)論是底層的動(dòng)環(huán)、傳輸、網(wǎng)絡(luò)、主機(jī),中間層的操作系統(tǒng)、中間件、數(shù)據(jù)庫(kù),還是上層的應(yīng)用都應(yīng)該進(jìn)行匯聚接入到統(tǒng)一事件臺(tái)。

  2. **事件歸集:**IT系統(tǒng)之間復(fù)雜的關(guān)聯(lián)性和全面立體的監(jiān)控體系背景下,一個(gè)故障會(huì)觸發(fā)多類指標(biāo)的告警,同一個(gè)指標(biāo)在故障未解除前也會(huì)重復(fù)產(chǎn)生大量的告警事件。如果將全部事件都展示出來(lái),那對(duì)于監(jiān)控處理人員將是“災(zāi)難性”的,所以需要進(jìn)行事件按照不同維度的歸集。

  3. **事件重定級(jí):**對(duì)于不同的事件不僅需要有適當(dāng)層次的事件分級(jí),同時(shí)也應(yīng)在故障時(shí)段內(nèi)事件的變化態(tài)勢(shì),以及IT系統(tǒng)架構(gòu)的健壯性方面,更加智能的完成事件重定級(jí)策略。事件分級(jí)是將事件當(dāng)前緊急程度進(jìn)行標(biāo)識(shí)顯示,事件重定級(jí)是從時(shí)間、架構(gòu)、指標(biāo)等多維度的度量后對(duì)事件的級(jí)別給予二次定義,讓運(yùn)維人員的寶貴時(shí)間可以投入到更有價(jià)值的事務(wù)中。

02.監(jiān)控?cái)?shù)據(jù)的可視化

  1. **統(tǒng)一可視化:**統(tǒng)一展示不同來(lái)源的事件,支持不同角色用戶管理不同的事件,包括事件的確認(rèn)、通知、屏蔽、轉(zhuǎn)工單等閉環(huán)操作,無(wú)需在不同監(jiān)控工具上多次操作。

  2. **事件策略可視化:**能夠?qū)⒚恳粋€(gè)事件處理策略由過(guò)去“黑盒”,轉(zhuǎn)變?yōu)檎麄€(gè)運(yùn)維團(tuán)隊(duì)都可以查看、定義透明的“水晶盒”。

  3. **處理過(guò)程可視化:**不僅事件處理策略運(yùn)維團(tuán)隊(duì)能夠共享,對(duì)于事件處理的過(guò)程與指標(biāo)也應(yīng)該共享給整個(gè)運(yùn)維團(tuán)隊(duì),以便于不同領(lǐng)域的管理員可以從自身業(yè)務(wù)出發(fā)來(lái)對(duì)這些事件處理給予評(píng)估及優(yōu)化。

  4. **故障分析可視化:**在故障出現(xiàn)后需要能夠快速的展示應(yīng)用與應(yīng)用、事件與事件之間的關(guān)聯(lián)關(guān)系,以便于運(yùn)維人員能夠快速完成故障的定位與處理。

03.運(yùn)營(yíng)工作的持續(xù)投入

對(duì)于IT監(jiān)控的標(biāo)桿企業(yè),雖然監(jiān)控的對(duì)象、環(huán)境各不相同,但是他們有一個(gè)共同的特點(diǎn)——對(duì)監(jiān)控系統(tǒng)運(yùn)營(yíng)工作的持續(xù)投入。例如:由專人負(fù)責(zé)告警治理,統(tǒng)計(jì)事件情況,分析事件風(fēng)暴的原因并形成告警策略,對(duì)告警進(jìn)行過(guò)濾、壓縮、關(guān)聯(lián)、歸集等策略設(shè)定及驗(yàn)證,并且會(huì)遵照PDCA循環(huán)方式不斷地對(duì)策略優(yōu)化,經(jīng)過(guò)一段事件的運(yùn)營(yíng)后,需要人工處理的事件,會(huì)下降至原始事件的10%至20%。為了更好的完成運(yùn)營(yíng)工作就要求監(jiān)控平臺(tái)能為監(jiān)控運(yùn)營(yíng)分析提供“武器與彈藥”,能夠提供從各個(gè)維度為運(yùn)營(yíng)人員提供數(shù)據(jù)和分析工具。

四、新一代IT監(jiān)控解決方案帶來(lái)的收益

01.提升處理效率

通過(guò)事件歸集智能地將警報(bào)分組和關(guān)聯(lián)到相關(guān)事件中,依靠事件時(shí)序圖和業(yè)務(wù)架構(gòu)圖模式,可以從時(shí)間和空間兩個(gè)維度進(jìn)行故障定位,從而更容易地發(fā)現(xiàn)關(guān)鍵問(wèn)題并找出根本原因。此外通過(guò)告警歸集將獲得事件的完整關(guān)聯(lián)信息,而不僅僅是單個(gè)告警的信息。例如,可以讓您快速發(fā)現(xiàn)整個(gè)集群遇到了磁盤(pán)問(wèn)題,而不是浪費(fèi)時(shí)間來(lái)分析單個(gè)主機(jī)的磁盤(pán)I / O警報(bào)。可以避免故障處理時(shí)間的浪費(fèi),提升故障處理時(shí)效。

02.提高監(jiān)控能效

在遵照PDCA循環(huán)方式進(jìn)行監(jiān)控的持續(xù)運(yùn)營(yíng)過(guò)程中,大量無(wú)效事件會(huì)被過(guò)濾、壓縮,事件信息會(huì)更加豐富,事件之間的關(guān)聯(lián)關(guān)系也將更加清晰。使得監(jiān)控管理員可以關(guān)注真正需要處理的故障,并且方便獲取與故障相關(guān)的信息,從而不斷提高監(jiān)控效能。