交大計網中心機房重整 醜小鴨變天鵝
短短一年間 解決機房陳年痼疾

2009-05-05
交通大學計算機與網路中心(以下簡稱計網中心)機房,不但是全校骨幹網路、教學區網路、行政區網路、宿舍區網路以及測試區網路之維運管理中心,也肩負著竹苗區域網路交換中心的重責大任,使用者群龐大,其重要性不可言喻;計網中心人員必須隨時保持最佳的維運管理,確保運作穩定順暢。但是計網中心機房內各個硬體建置,由於長期使用,除了產生年久失修的情形之外,雜亂無章的硬體設備及線路也讓計網中心人員常感無法有效管理。
▲由於機房長期外包,導致雜亂無章不易有效管理。雖然重整機房費時費力,但是交通大學計網中心決定大刀闊斧,重新整理累積幾十年的機房問題。左起交通大學計算機與網路中心主任林盈達、網路系統組組長高義智。
「撇開缺乏妥善整理的環境與機櫃不說,那些龐雜卻往往沒有標示的線路,都潛藏著造成管理上疏忽出錯的高度風險。」交大計網中心主任林盈達表示,除了機房網路管理層面的問題外,電力佈線未能符合機房電力安全的基本要求,雜亂未整理的機房所產生消防安全的隱憂,更令人憂心,這些都是刻不容緩,必須著手解決的問題。因此交大計網中心訂下機房重整方針,「在影響維運最低的情況下,就地重建」。  

長期委外 雜亂無章  

造成計網中心的機房管理性欠佳,最大的癥結點在於長期委外。長久以來的機房外包,由於任何事情都必須仰賴委外的廠商,久而久之卻產生廠商的不可取代性,每當機房出問題時,只能找回原來委外的廠商解決問題。而廠商卻僅止於「解決就好」,因此導致長期累積的線路及設備配置雜亂無章。委外廠商更可能為了避免遭到取代,而未將機房內線路加以清楚標示,以致計網中心人員無法掌握機房內線路的分配狀況,「換不掉委外廠商的結果,就造成機房雜亂無法管理的惡性循環。」林盈達表示。  

機房管理無法有效管理不只造成網路可能斷線,其實空調、水電或消防系統等環境問題才是最大的潛在風險。天花板漏水、冷氣管線漏水、雜物隨意堆置、新舊設備隨意放置等問題,都可能構成消防火警、線路短路、機器使用年限降低等問題。且一旦產生消防危機,機房損失後果不堪設想。「由於不知道何時有可能出大問題,考慮潛在風險以及仔細評估後,決定重整機房,由內部人員重新自行掌握管理、維護的控制權。」交大計網中心網路系統組組長高義智說。  

由於之前委外廠商幾乎完全沒有在機房內進行任何標示的工作,計網中心人員對於機房內配置無法掌握,如果僅靠計網中心人員重整機房線路以及機櫃配置,會面臨極大的考驗,因此決定藉由業界專精於大型資料中心的專業人士,協助執行初期機房重新規劃的作業。  

機房重整 範圍浩大  

「機房重整並不容易,從線路、電力、空調、消防到監控與管理,都必須仔細重整。」高義智表示,在重整計畫中,第一步是重新規劃所有機櫃,接著對光纖、UTP線及電力線進行查、修、整及標示,並完成文件化記錄。重新查察線路是一件相當吃重的工作,因為線路重整工程不像一般新建置工程可以任意地拔插線作測試。特別是當一堆線路纏絞在一起時,判斷哪些是有用的或沒用的、從哪裡來又接到那裡去,都要非常小心,因此初期查線的工作就佔用了大部分的時間,「除了對預期中可能的狀況,需要事先規畫好緊急處置方案外,更要有隨時面對突發狀況的心理準備。」

▲比起一年前到處堆放雜物的機房,重整後顯得乾淨明亮,淨空的走道讓冷卻對流更為順暢,節省耗電也間接降低消防安全威脅。

針對老舊不堪以及不敷使用的電力及消防系統,計網中心將絕大部分的費用投資在此方面的重建。在電力系統的部份,重整工作包括建置110V/220V雙供電及雙迴路之電力系統。「因為原機房之電力系統是在20年前建置,當時並未考量雙供電及雙迴路之設計,且部份電力系統完全不符合現行電力安全法規。這一部份須改善的範圍遠較我們初期評估的還大,除配電盤更新外,同時還需更新電力配線、UPS、電力插座,並計算電力負載。」高義智表示,冷氣空調也在改善之列,電力配線的材質,選擇通過國家品質認證之品牌,電力方面的規劃及施工,則借重具甲級電力技師執照之專業人員。  

而建置主動式自動消防系統也是這次機房重整的重點工作,原機房內僅配置零星之手提式滅火器,經評估後認為已不符合無人機房之基本消防安全需求。因此委請具消防技師資格之專業人員負責全案之設計、規劃及監造,在機房中的內室安置30罐大型鋼瓶消防系統,自動感應突發的消防狀況。

▲所有機房內網通設備及線路,均清楚標示,並且記錄成文件,讓計網中心機房維護人員方便管理。

除了上述基礎建設更新外,更藉此機房重建的機會,強化機房的安全管理。改善了機房環境監控系統、門禁監控,並且清點機房資產,建立異地備援機制,整體環境改善都在重整範圍內。  

專業Know-How 不能外包  

「委外工作並非不好,但是站在我們需要擁有解決問題的能力以及Know-How管理兩個面向來看,就不適合。」林盈達指出,機房委外的結果導致計網中心的Know-How也跟著外包,計網中心人員就算擁有管理權限,也沒有解決機房內問題的能力。「計網中心這一年來,除了在機房管理上有大幅進步外,更令人欣慰的是團隊能力的驚人成長。」高義智說,以往過度仰賴外包廠商的後遺症之一,就是減弱了內部人員求知的熱誠與動力。藉由這次機房重整,徹底扭轉了這樣的現象。

▲除了網通設備之外,新架設的變電箱也重新標示,讓管理人員一目瞭然。

高義智表示,以往計網中心並未要求內部同仁重視機房管理知識的累積,負責機房管理業務的同仁,不知怎麼規劃、設計及管理機房才最恰當。然而管理人員的專業知識如果不能優於廠商,在整個機房重整過程中,就很容易被廠商誤導而將寶貴的資源錯置在缺少效益的事情上,因此才需要不斷累積專業知識,提升Know-How,才能全面的管理機房。

▲機房內部的小房間內,架設了30罐大型滅火鋼瓶,當有消防危機時,自動連接機房內消防系統進行噴灑。

「除了機房管理外,還有一項知識領域,也是過去常被忽視的,那就是『專案管理』。」高義智指出,有鑑於過去計網中心多數人員並未參與大型專案建置,對於專案管理相關議題,如經費編列、流程規劃、進度規劃、風險管控等,大多沒有什麼概念,因此教導同仁專案管理知識及技巧,也是計網中心目前著重的重點。「我們一方面扮演專案經理的角色,協調各種內外部衝突,並克服種種技術問題。一方面不忘隨時訓練同仁專案管理的知識與技巧。除了建立同仁對此次機房重整專案之使命感,更期待同仁因參與此次專案,在團隊互動與專業均有所成長,將來可以成為獨當一面的專案管理者。」高義智表示。

▲機房環境監控系統,除了能監看機房內部,還可管理機房內所有設備的使用狀況。

導入ISMS 間接提升效率  

由於上從主管支持,下到每個參與執行的員工共同努力,僅僅花了一年的時間,便將機房管理的陳年老問題一次解決,交大計網中心並在今年三月間取得ISMS認證。「ISO化的結果讓交大計網中心朝向更完善的資訊安全管理,也讓內部人員處理使用者問題的時間大幅縮短,」林盈達強調,「能夠減少處理Foreground Job的時間,就可以增加執行Background Job的時間,計網中心人員能夠將更多的心力放在執行未來計畫的工作,機房重整以及ISO化後,也間接的提升了整體員工的工作效率。」


追蹤我們Featrue us

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!