Nagios Google 監控網路

整合運用Google行事曆 呈現監控網路服務報表

2014-11-20
Nagios是開源碼社群中頗富盛名的監控軟體,Google行事曆則是目前最常見的網路服務,本文將結合這兩項利器,將Nagios所偵測到的主機或服務狀態記錄到Google行事曆內,網管人員只要定時查看Google行事曆就能夠掌握主機服務狀態。
網管人員最主要的責任在於確保網路服務暢通,因此也常會利用監控軟體來監控網路服務的狀態,並依其回覆的狀況來建立網管報表,讓管理者更容易地掌控網路服務的狀況。此類的網管系統通常都是記錄那一天的那一個時段網路服務的狀態,例如10月10號早上10點網站伺服器發生中斷服務的現象。

這一類的記錄有點像日常生活中常用的「行事曆」功能,這不免讓筆者突發奇想,是否可以利用開放原始碼社群中最有名的監控軟體(Nagios)來監控網路服務,並在監控到網路服務異常的時候,將相關的資訊記錄到Google行事曆功能上,管理者只要定時查看自己的行事曆,就能完整地掌握網路服務的狀態。本次實作將使用到表1內所示的軟體。

表1 實作所需軟體

什麼是Nagios

一般來講,監控設備通常會考慮下列幾個面向。如圖1所示,首先決定要監控什麼,監控的主體通常為主機(Host)或服務(Service),主機指的是電腦主機或網路設備(如路由器等等),而服務即是指一般所熟知的網路服務(例如網站伺服器服務、FTP服務等等),通常一個主機會運作多個服務。


▲圖1 監控設備運作流程。

接下來第二個思考是,在什麼時間要進行監控(亦即設定監控期間)雖然在一般的情況下通常會想要24小時不間斷地監控,但在某些情況下,例如僅要在上班的時間進行監控設備即可,所以一個好的監控軟體應該要可提供設定監控的時間區間。

另外,由於監控服務通常都是利用網路來進行(利用監測封包去探測被監控的主機或服務,而後再根據該主機或服務來判斷是否已停止服務),而此類的方式常會因網路的狀態而有誤判的情況,最常見的是該主機或服務其實並未中斷服務,但因網路不穩的情況,以致於一直遲遲無法接受到被監控主機的回覆,而誤判為該主機或服務為停止服務的情況。

因此,通常會設定一個門檻值,例如必須連續三次皆無法得到被監控主機或服務的回應,方可判定該主機或服務為停止服務的狀態。最後,要再給監控服務主機管理者的連絡資料,如手機號碼(可提供簡訊通知)或電子郵件信箱,以便偵測到異常時通知管理者處理之用。

本文將介紹一個在開源碼社群中頗富盛名的監控軟體Nagios,將Nagios與Google的行事曆做結合,將所偵測到的主機或服務狀態記錄在行事曆上。

首先安裝Nagios(筆者所使用的版本為4.0.8),請至Nagios官方網站下載並解壓縮,然後利用下列指令來進行安裝(其中#為註解):



追蹤我們Featrue us

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!