統(tǒng)一運維監(jiān)控方案

來源: 發(fā)布時間:2023-06-18

Argus運維監(jiān)控系統(tǒng)基于ZABBIX的預處理及自動發(fā)現(xiàn)功能,有效整合PROMETHEUS。

環(huán)境復雜 :在現(xiàn)有的架構環(huán)境中,既有虛擬主機,又有 Kubernets 集群 

監(jiān)控工具多 : 在現(xiàn)有的環(huán)境中的監(jiān)控工具既有zabbix,又有 prometheus § Zabbix的監(jiān)控項及Prometheus的配置仍為大量的 手工操作 § 每套工具有單獨的技術棧,維護成本高 

無統(tǒng)一化告警人管理 :zabbix及grafana中都有告警人配置

數(shù)據(jù)采集 : Prometheus 負責Exporter及 Kubernets集群的 監(jiān)控項采集,并單獨于Kubernets集群外部署 § Zabbix負責虛擬主機監(jiān)控項的采集 

事件處理 : Zabbix 通過HTTP agent 方式查詢不同的 prometheus 采集節(jié)點,并通過監(jiān)控項模板中監(jiān)控項 的預處理及自動發(fā)現(xiàn)功能自動創(chuàng)建不同應用名稱的監(jiān) 控項及監(jiān)控項閾值 § Zabbix 通過不同監(jiān)控項的當前數(shù)據(jù)判斷閾值并觸 發(fā)不同閾值級別下相應的動作 § 各閾值動作通過應用名關聯(lián)不同的用戶組,觸發(fā) 釘釘通知到對應的研發(fā)團隊 即使零經(jīng)驗的小白用戶,也可以通過Argus管理IT運維監(jiān)控,執(zhí)行運維監(jiān)控管理。統(tǒng)一運維監(jiān)控方案

隨著數(shù)字化進程的加深,企業(yè)在分治了很久以后,開始進入到統(tǒng)一運維管理的階段。由于“分久”,出現(xiàn)了敏穩(wěn)兩態(tài)不同的專業(yè)領域,傳統(tǒng)企業(yè)運維的歷史包袱很重,一些穩(wěn)態(tài)的重中之重應用無法完全轉移到敏態(tài)環(huán)境中,因此導致了數(shù)據(jù)的多樣化、復雜程度極高等特點,比如日志數(shù)據(jù)、告警數(shù)據(jù)、調用鏈數(shù)據(jù)、拓撲數(shù)據(jù)以及流程產(chǎn)生的信息數(shù)據(jù)等,導致分治變得十分麻煩。另外,這些繁冗復雜的數(shù)據(jù)視角各異,沒有可以從某一種業(yè)務視角或組件視角去看多樣化工具的能力,加之混合云的出現(xiàn),很多業(yè)務轉移到公有云或私有云上,使得數(shù)據(jù)孤島狀態(tài)加重,治理起來更加困難。

現(xiàn)狀需求:

1、監(jiān)控工具種類繁多,缺乏全局視角,難以整合;

2、運維監(jiān)控數(shù)據(jù)快速增長,尚未有效整合;

3、缺少智能運維分析手段,聯(lián)動能力不足;

4、欠缺知識共享系統(tǒng),未能對運維經(jīng)驗有效積累。

需求總結:

希望有一種手段能夠通過人機合作的方式來完成知識的共享,把人的能力逐漸地變成一種組織和平臺的能力。 IT運維監(jiān)控系統(tǒng)排名Argus-國內自研簡單易部署的運維監(jiān)控平臺。

基于信創(chuàng)環(huán)境建立信創(chuàng)運維服務體系,滿足跨平臺對信創(chuàng)軟硬件設備提供運維監(jiān)控管理功能,包括不限于服務器(ARM架構、MIPS架構、X86架構等)、網(wǎng)絡設備、數(shù)據(jù)庫(國產(chǎn)數(shù)據(jù)庫及非國產(chǎn)數(shù)據(jù)庫)、應用服務器、存儲、業(yè)務系統(tǒng)等全域多視角地監(jiān)控和管理,幫助用戶在極短時間發(fā)現(xiàn)問題、分析出原因、得出解決方案,使故障問題能夠在極短時間內解決,保證業(yè)務系統(tǒng)的連續(xù)性。Argus 運維監(jiān)控平臺是跨區(qū)域、跨部門的運維系統(tǒng)監(jiān)控平臺,實現(xiàn)包括不限于服務器(ARM架構、MIPS架構、X86架構等)、網(wǎng)絡設備、數(shù)據(jù)庫(國產(chǎn)數(shù)據(jù)庫及非國產(chǎn)數(shù)據(jù)庫)、中間件、存儲、業(yè)務系統(tǒng)等運維監(jiān)控。通過對基礎實施、信息系統(tǒng)、項目進度的總體監(jiān)控實現(xiàn)運維體系的有效運行,保障信創(chuàng)項目順利開展。提供自動化運維、智能化運維功能,打破了人工現(xiàn)場運維效率低下的現(xiàn)狀;從信息采集、健康巡檢、補丁分發(fā)等場景實現(xiàn)功能自動化;利用智能學習、大數(shù)據(jù)分析、機器學習等技術手段,實現(xiàn)故障從人工處理到無人值守的變革,降低故障處理時間的同時,實現(xiàn)被動運維到主動干預的轉變。

2020年12月13日,據(jù)海外媒體報道,一個名為APT的網(wǎng)絡入侵組織把世界出名網(wǎng)管軟件廠商SolarWinds作為入侵目標。這次APT攻擊首先是對SolarWinds旗下的Orion網(wǎng)絡監(jiān)控軟件更新服務器進行入侵,并在軟件更新(Orion)中植入了惡意代碼。透露大約有1.8萬客戶在其系統(tǒng)上部署了該更新,且對美國財政部高層領導使用的電子郵件系統(tǒng)也造成了影響。

SolarWinds的系統(tǒng)被攻擊之后,已導致全球許多組織的網(wǎng)絡遭到破壞,涉及的供應鏈范圍極為廣大,被稱為2020年美國極大網(wǎng)絡安全事件。

“太陽風”(SolarWinds) 是一家專職提供IT監(jiān)控和運維解決方案的商業(yè)公司。其產(chǎn)品SolarWinds Orion Network Performance Monitor(NPM)是集網(wǎng)絡監(jiān)測、設備性能維護管理、故障監(jiān)控、網(wǎng)絡實時流量監(jiān)控和歷史數(shù)據(jù)統(tǒng)計、匯總和歷史數(shù)據(jù)分析、虛擬數(shù)據(jù)中心監(jiān)控、網(wǎng)絡拓撲監(jiān)控等功能于一體的網(wǎng)絡管理系統(tǒng)。該軟件主要是用于企業(yè)內部網(wǎng)絡管理,目前全球客戶超過32萬家。SolarWinds作為一個齊全的IT管理系統(tǒng)還有一些功能的欠缺,而且中文支持也是一個國內推廣的難題。像同一類型的軟件Hostmonitor、CA Unicenter也是存在同樣的問題。 Argus運維監(jiān)控系統(tǒng)可手動設置貼合業(yè)務的事件聚合規(guī)則、消息分派規(guī)則,并可查看與管理事件集、事件。

運維監(jiān)控系統(tǒng)一般采用分層的方式劃分監(jiān)控對象。在我們的監(jiān)控系統(tǒng)中,主要關注以下幾種類型的監(jiān)控對象:1、主機監(jiān)控,主要指主機節(jié)點軟、硬件資源的一些監(jiān)控數(shù)據(jù)。2、容器環(huán)境監(jiān)控,主要指服務所處運行環(huán)境的一些監(jiān)控數(shù)據(jù)。3、應用服務監(jiān)控,主要指服務本身的基礎數(shù)據(jù)指標,提現(xiàn)服務自身的運行狀況。4、第三方接口監(jiān)控,主要指調用其他外部服務接口的情況。對于應用服務和第三方接口監(jiān)控,我們常用的指標包括:響應時間、請求量QPS、成功率。Argus運維監(jiān)控系統(tǒng)配有Syslog 日志接收和分析。數(shù)據(jù)中心統(tǒng)一運維監(jiān)控管理軟件

Argus優(yōu)化了 Promethues Exporter Http 采集接入流程,可自動創(chuàng)建指標。統(tǒng)一運維監(jiān)控方案

觀縱在協(xié)調交付與研發(fā)做信創(chuàng)產(chǎn)品適配,幫助客戶在內部搭建信創(chuàng)環(huán)境的時候發(fā)現(xiàn),如果想讓運維行業(yè)的信創(chuàng)產(chǎn)業(yè)高質量發(fā)展,是依靠自主創(chuàng)新研發(fā)產(chǎn)品是不夠的,還需要有領航者來為運維行業(yè)發(fā)展做“規(guī)劃”,給予客戶足夠的安全感和信任感。

如今,觀縱的Argus運維監(jiān)控系統(tǒng)目前已獲得部分信創(chuàng)適配證書。未來觀縱將繼續(xù)投入人力與物力,對產(chǎn)品進行創(chuàng)新實踐,加快其在信創(chuàng)領域的運維場景落地應用,攜手上下游合作伙伴共建生態(tài),領導智能運維行業(yè)向高質量發(fā)展。 統(tǒng)一運維監(jiān)控方案

上海觀縱科技有限公司成立于2022-11-14年,在此之前我們已在webfunny前端監(jiān)控,webfunny前端埋點,全鏈路應用性能監(jiān)控,Argus-IT運維監(jiān)控行業(yè)中有了多年的生產(chǎn)和服務經(jīng)驗,深受經(jīng)銷商和客戶的好評。我們從一個名不見經(jīng)傳的小公司,慢慢的適應了市場的需求,得到了越來越多的客戶認可。公司現(xiàn)在主要提供webfunny前端監(jiān)控,webfunny前端埋點,全鏈路應用性能監(jiān)控,Argus-IT運維監(jiān)控等業(yè)務,從業(yè)人員均有webfunny前端監(jiān)控,webfunny前端埋點,全鏈路應用性能監(jiān)控,Argus-IT運維監(jiān)控行內多年經(jīng)驗。公司員工技術嫻熟、責任心強。公司秉承客戶是上帝的原則,急客戶所急,想客戶所想,熱情服務。公司秉承以人為本,科技創(chuàng)新,市場先導,和諧共贏的理念,建立一支由webfunny前端監(jiān)控,webfunny前端埋點,全鏈路應用性能監(jiān)控,Argus-IT運維監(jiān)控**組成的顧問團隊,由經(jīng)驗豐富的技術人員組成的研發(fā)和應用團隊。webfunny,walkingfunny,argus秉承著誠信服務、產(chǎn)品求新的經(jīng)營原則,對于員工素質有嚴格的把控和要求,為webfunny前端監(jiān)控,webfunny前端埋點,全鏈路應用性能監(jiān)控,Argus-IT運維監(jiān)控行業(yè)用戶提供完善的售前和售后服務。