數(shù)據(jù)準(zhǔn)入:所有數(shù)據(jù)對象化,定義固定字段、對象描述字段、對象具體數(shù)值三類,便于后續(xù)管理。數(shù)據(jù)血緣:數(shù)據(jù)采集階段記錄數(shù)據(jù)依賴關(guān)系,明確展示數(shù)據(jù)血緣,避免數(shù)據(jù)關(guān)聯(lián)錯誤同時可比較大化減少數(shù)據(jù)冗余。數(shù)據(jù)生命周期:嚴(yán)格控制數(shù)據(jù)存儲生命周期,定時對冗余數(shù)據(jù)進(jìn)行清洗校驗,確保整體性能。數(shù)據(jù)完整性:基于數(shù)據(jù)血緣,對所有數(shù)據(jù)的完整性進(jìn)行校驗,不僅對單條數(shù)據(jù)本身同時需要對上下關(guān)聯(lián)數(shù)據(jù)進(jìn)行校驗。數(shù)據(jù)責(zé)任制:將各類數(shù)據(jù)的正確性和關(guān)聯(lián)性責(zé)任到各個專業(yè)團(tuán)隊,從源頭控制數(shù)據(jù)質(zhì)量。即使零經(jīng)驗的小白用戶,也可以通過Argus管理IT運維監(jiān)控,執(zhí)行運維監(jiān)控管理??煽康闹悄芑\維監(jiān)控方案
Argus運維監(jiān)控系統(tǒng)基于ZABBIX的預(yù)處理及自動發(fā)現(xiàn)功能,有效整合PROMETHEUS。
環(huán)境復(fù)雜 :在現(xiàn)有的架構(gòu)環(huán)境中,既有虛擬主機,又有 Kubernets 集群
監(jiān)控工具多 : 在現(xiàn)有的環(huán)境中的監(jiān)控工具既有zabbix,又有 prometheus § Zabbix的監(jiān)控項及Prometheus的配置仍為大量的 手工操作 § 每套工具有單獨的技術(shù)棧,維護(hù)成本高
無統(tǒng)一化告警人管理 :zabbix及grafana中都有告警人配置
數(shù)據(jù)采集 : Prometheus 負(fù)責(zé)Exporter及 Kubernets集群的 監(jiān)控項采集,并單獨于Kubernets集群外部署 § Zabbix負(fù)責(zé)虛擬主機監(jiān)控項的采集
事件處理 : Zabbix 通過HTTP agent 方式查詢不同的 prometheus 采集節(jié)點,并通過監(jiān)控項模板中監(jiān)控項 的預(yù)處理及自動發(fā)現(xiàn)功能自動創(chuàng)建不同應(yīng)用名稱的監(jiān) 控項及監(jiān)控項閾值 § Zabbix 通過不同監(jiān)控項的當(dāng)前數(shù)據(jù)判斷閾值并觸 發(fā)不同閾值級別下相應(yīng)的動作 § 各閾值動作通過應(yīng)用名關(guān)聯(lián)不同的用戶組,觸發(fā) 釘釘通知到對應(yīng)的研發(fā)團(tuán)隊 國內(nèi)運維監(jiān)控管理系統(tǒng)運維、監(jiān)控系統(tǒng)的本質(zhì)是通過發(fā)現(xiàn)故障、解決故障、預(yù)防故障來為了保障業(yè)務(wù)的穩(wěn)定。
基于Zabbix來構(gòu)建整個監(jiān)控體系生態(tài)圈。下面我們就來監(jiān)控系統(tǒng)的整個流程:數(shù)據(jù)采集:Zabbix通過SNMP、Agent、ICMP、SSH、IPMI等對系統(tǒng)進(jìn)行數(shù)據(jù)采集;數(shù)據(jù)存儲:Zabbix存儲在MySQL上,也可以存儲在其他數(shù)據(jù)庫服務(wù);使用數(shù)據(jù)庫是必備技能。數(shù)據(jù)分析:當(dāng)我們事后需要復(fù)盤分析故障時,Zabbix能給我們提供圖形以及時間等相關(guān)信息,方面我們確定故障所在;數(shù)據(jù)展示:Web界面展示、(移動APP、java_php開發(fā)一個Web界面也可以);監(jiān)控報警:電話報警、郵件報警、微信報警、短信報警、報警升級機制等(無論什么報警都可以);報警處理:當(dāng)接收到報警,我們需要根據(jù)故障的級別進(jìn)行處理,比如:重要緊急、重要不緊急,等。根據(jù)故障的級別,配合相關(guān)的人員進(jìn)行快速處理。
上海觀縱科技有限公司是Zabbix中國認(rèn)證合作伙伴,以天下沒有難做的運維為愿景,致力于幫助用戶使用更簡單、保障更完備的運維監(jiān)控,成為業(yè)務(wù)運行的堅實后盾。本著為用戶創(chuàng)造價值的宗旨,觀縱做到釋放人力、集約資源的同時,提升事件處理效率、減少運維隱患。通過不斷積累行業(yè)經(jīng)驗的匠維模型研發(fā),實現(xiàn)運維自動化、智能化。從而實現(xiàn)故障有歸因、處理有留痕,自動預(yù)測運維態(tài)勢,讓企業(yè)把握運維動態(tài),降低潛在風(fēng)險,解放人力、節(jié)約時間成本。運維監(jiān)控體系一般來說包括數(shù)據(jù)采集、數(shù)據(jù)檢測、告警管理、故障管理、視圖管理和監(jiān)控管理6大模塊。
對于網(wǎng)絡(luò)出口與網(wǎng)絡(luò)專線的有效監(jiān)控與分析,既能協(xié)助業(yè)務(wù)運維同學(xué)有效地定位業(yè)務(wù)異常、評估業(yè)務(wù)服務(wù)質(zhì)量等,也能有效地度量業(yè)務(wù)整體運營成本,畢竟現(xiàn)在帶寬的使用成本在整體運營成本中也是占比越來越大。相信運維同學(xué)多少都會遇到下面等較高頻的使用場景:
這條專線當(dāng)前利用率多少?
在已經(jīng)使用的流量中,某個IP使用了多少流量?這些所產(chǎn)生的流量是基于什么協(xié)議與方向?
專線與網(wǎng)絡(luò)出口的丟包率與時延是怎么樣的?
每條專線中主要是哪些務(wù)在用?哪個是“地主客戶”?對
于網(wǎng)絡(luò)流量的監(jiān)控來說,其實中心是一個分析平臺,通過把采集到的各種流量包抓取過來,然后再把相應(yīng)的流量送入分析集群。 Argus優(yōu)化了 Promethues Exporter Http 采集接入流程,可自動創(chuàng)建指標(biāo)。業(yè)務(wù)智慧運維監(jiān)控平臺
一個集運維監(jiān)控、運維自動化、運維安全合規(guī)、運維成本管控、運維協(xié)同等能力屬性的大一統(tǒng)平臺,是比較好解??煽康闹悄芑\維監(jiān)控方案
運維監(jiān)控的流程包括:
發(fā)現(xiàn)問題:當(dāng)系統(tǒng)發(fā)生故障報警,我們會收到故障報警的信息定位問題:故障郵件一般都會寫某某主機故障、具體故障的內(nèi)容,我們需要對報警內(nèi)容進(jìn)行分析,比如一臺服務(wù)器連不上:我們就需要考慮是網(wǎng)絡(luò)問題、還是負(fù)載太高導(dǎo)致長時間無法連接,又或者某開發(fā)觸發(fā)了防火墻禁止的相關(guān)策略等等,我們就需要去分析故障具體原因。解決問題:當(dāng)然我們了解到故障的原因后,就需要通過故障解決的優(yōu)先級去解決該故障??偨Y(jié)問題:當(dāng)我們解決完重大故障后,需要對故障原因以及防范進(jìn)行總結(jié)歸納,避免以后重復(fù)出現(xiàn)。 可靠的智能化運維監(jiān)控方案
上海觀縱科技有限公司總部位于上海市奉賢區(qū)望園南路1288弄80號1904、1909室,是一家一般項目:技術(shù)服務(wù)、技術(shù)開發(fā)、技術(shù)咨詢、技術(shù)交流、技術(shù)轉(zhuǎn)讓、技術(shù)推廣;軟件開發(fā);人工智能基礎(chǔ)軟件開發(fā);人工智能應(yīng)用軟件開發(fā);數(shù)據(jù)處理服務(wù);信息技術(shù)咨詢服務(wù);信息系統(tǒng)集成服務(wù):信息系統(tǒng)運行維護(hù)服務(wù);計算機系統(tǒng)服務(wù);軟件銷售;計算機軟硬件及輔助設(shè)備批發(fā);計算機軟硬件及輔助設(shè)備零售;電子產(chǎn)品銷售;通信設(shè)備銷售;通訊設(shè)備銷售;咨詢策劃服務(wù);市場調(diào)查(不含涉外調(diào)查);廣告制作;廣告發(fā)布;廣告設(shè)計、代理;會議及展覽服務(wù);貨物進(jìn)出口。(除依法須經(jīng)批準(zhǔn)的項目外,憑營業(yè)執(zhí)照依法自主開展經(jīng)營活動) 許可項目:建筑智能化系統(tǒng)設(shè)計;建設(shè)工程施工;網(wǎng)絡(luò)文化經(jīng)營;互聯(lián)網(wǎng)信息服務(wù)。(依法須經(jīng)批準(zhǔn)的項目,經(jīng)相關(guān)部門批準(zhǔn)后方可開展經(jīng)營活動,具體經(jīng)營項目以相關(guān)部門批準(zhǔn)文件或許可證件為準(zhǔn))的公司。公司自創(chuàng)立以來,投身于webfunny前端監(jiān)控,webfunny前端埋點,全鏈路應(yīng)用性能監(jiān)控,Argus-IT運維監(jiān)控,是傳媒、廣電的主力軍。觀縱科技始終以本分踏實的精神和必勝的信念,影響并帶動團(tuán)隊取得成功。觀縱科技始終關(guān)注自身,在風(fēng)云變化的時代,對自身的建設(shè)毫不懈怠,高度的專注與執(zhí)著使觀縱科技在行業(yè)的從容而自信。