將此篇文章跟 Facebook 上的朋友分享將此篇文章跟 Plurk 上的朋友分享將此篇文章跟 Twitter 上的朋友分享列印轉寄
2018/3/29

人工智慧成基礎架構新服務 硬碟損壞不再突如其來

AI相助儲存系統維運 預測洞察減輕修護負擔

余采霏
在強調敏捷、動態且彈性的需求下,企業需要更智慧且自動化的工具,來因應IT維運所需。不少基礎架構解決方案供應商正將人工智慧與機器學習帶進IT基礎架構之中,以減化企業維運負擔。
長期以來,IT維運團隊被賦予的核心任務之一便是確保服務正常運行。但是隨著流程、技術趨勢以及工具的改變,這項任務已經變得愈來愈棘手,大量產生的資料加上愈益複雜的IT環境,在強調敏捷、動態且彈性的需求下,企業需要更智慧且自動化的工具,來因應IT維運所需。不少基礎架構解決方案供應商正將人工智慧與機器學習帶進IT基礎架構之中,以減化企業維運負擔。

去年儲存業者NetApp推出具備人工智慧的虛擬支援助理Elio,以及Active IQ雲端分析功能,讓IT維運團隊可藉此輕鬆獲取洞察見解,將心力專注在創新營運,而非費心管理基礎架構。無獨有偶,自主研發資料備份、災難備援及雲端儲存管理軟體的先智雲端(ProphetStor),有鑑於企業硬碟汰換的不確定性以及可能對儲存設備造成的效能影響與營運風險,發布Disk Prophet硬碟生命周期解決方案,除了可預防資料流失問題之外,利用Disk Prophet不間斷地從傳統硬碟或固態硬碟中採集到的資料,不僅可預測硬碟行為,還提供了可執行化的洞悉(Actionable Insights)。

以人工智慧為後盾 改善客戶體驗

集結多年來的客戶經驗,藉由人工智慧與深度學習技術,淬鍊出資料智慧,以協助企業提早預知可能故障,並且更主動地提供支援,已成為一種新型態的服務,而且正快速擴展到儲存設備領域之中,去年NetApp也加入此一行列,在Insight技術大會正式發表Elio以及Active IQ兩項方案,用以協助企業運用前瞻洞察,做出正確決策,同時改善數位體驗。

Elio主要是以IBM Watson認知運算服務為基礎,其收集了NetApp所有支援案例記錄,並且從中學習,因而能夠針對企業問題,快速地找到最佳答案。而Active IQ則是結合了預測分析和主動式支援的雲端分析技術,可協助提高儲存效率、確保組態符合法規遵循,同時還能透過升級建議來降低風險。


▲NetApp預估,Elio虛擬支援助理找到最佳答案的速度,能比傳統方法快上四倍。


NetApp台灣技術長張展智舉例,Elio可以運用在開發流程的文件支援中,當系統整合商手上的文件不夠完整,或是不確定原廠文件哪一個版本最正確時,透過Elio可以提供初步事件排除,找出最佳解答。萬一遇到更關鍵的問題,還能自動轉交客服支援團隊進行服務。

而Active IQ雲端分析功能是NetApp AutoSupport演進而來,其運用了社群智慧,可以針對NetApp所有產品提供豐富見解及預測分析,並且主動解決問題。他提到,很多企業都是設備故障發生後向NetApp支援中心通報,再由支援中心開立專案提供服務,而透過Active IQ則可以做到在故障發生前,先行主動告知企業可能會發生哪些故障問題,如此一來就可以提早擬妥應對之道。目前Active IQ可提供風險顧問、儲存效率顧問及互通性顧問等三項功能。

主動式預知防護提前做好資料保護

▲先智雲端業務經理勵宗達指出,預測硬碟生命周期最主要的目的,就是要因應突如其來的硬碟毀損,對應用服務所造成效能的影響。甚至,更進一步地,讓硬碟汰換成為排程可控的情況。
傳統以來,在企業資訊架構中,硬碟故障汰換幾乎已成家常便飯。隨著資料量不斷激增,企業從Scale-up的儲存架構轉向Scale-out分散式儲存的架構,不變的是,這些因應資料增長而大幅增加的硬碟,依然可能故障或屆臨生命周期,當儲存環境愈大,甚至天天都可能遇上硬碟汰換的需求,IT維護將相對繁瑣。

而另一方面,雖然分散式儲存架構提供了自動複寫的機制來確保資料不會損毀,硬碟更換並不會造成資料的損失,但是在更換的時間點,卻會讓儲存設備的效能比較低,為了要維持三份資料,硬碟在完成更換後,資料會重新平衡(Rebalance),當資料不斷在節點之間互傳,服務效能也可能因而受到影響。

先智雲端業務經理勵宗達指出,以前硬碟是否毀損的判斷法則,主要都是以S.M.A.R.T.檢測數據或以購買日期來估算是否需要汰換,但是這種方式的準確度太低,而Disk Prophet可以在預測硬碟故障的45天前主動示警,且預測準確率高達95%以上,有了這些資訊,IT人員可以依照預測結果來制定最佳處理策略。」他強調,預測硬碟生命周期最主要的目的,就是要因應突如其來的硬碟毀損,對應用服務所造成效能的影響。甚至,更進一步地,讓硬碟汰換成為排程可控的情況,例如當企業知道未來兩周中有幾顆硬碟或是哪幾顆硬碟已經到了生命周期,就可以規劃汰換計畫,或是依據預測結果變更資料備份排程,以縮短復原點目標(RPO)、預防備份失敗。

目前Disk Prophet主要適用於OpenStack、Server SAN、軟體定義儲存或是超融合基礎架構等以x86伺服器組合而成的節點架構,除了機械式硬碟之外,Flash、SSD、NVMe SSD都可以適用,Disk Prophet也提供儀表板介面,並且提供RESTful API給第三方合作夥伴整合。而計費方法主要有兩種模式,一是採用雲端服務,每年訂閱。先智雲端已在AWS架設Disk Prophet預測主機,企業可以在本地端安裝代理程式,將資訊傳上預測主機,取得結果後再回送給企業,這種模式以1,000顆硬碟為單位。倘若企業對於資料傳輸至雲端存有安全疑慮,預測主機也能部署於企業內部,以100顆為單位,授權則採買斷機制。但企業仍需要簽定維護升級合約,原因是,硬碟也會改朝換代,當企業採用新硬碟時,若是預測主機未升級支援,就很難提供準確的預測。

勵宗達認為,隨著技術的演進,現今機器學習演算法已經可以更容易地取得,不同的需求已經有固定的演算法配套,有了程式庫(Library)之後,門檻已經降低。但是運用演算法來進行預測並沒有那麼單純,資料的前處理才是預測精準與否的關鍵,一是收集而來的初始資料本身就有很多雜訊,其二,光是硬碟的感測器就會產生70至80種的數據,數據本身帶有不同的特性。先智雲端在開發的過程中,不僅進行訊號處理濾掉雜訊,還針對不同的資料特性分別進行前處理,然後才以這些「乾淨」的資料建立預測模型,這也是為何Disk Prophet可以有高達95%以上準確率的原因。

這篇文章讓你覺得滿意不滿意
送出
相關文章
開發人員引領AI創新之旅
從普悠瑪事故看人機協作 AI自動駕駛將面臨抉擇
新運算科技札根人才培育
從核心到邊緣 資料中心轉型變革
穩定供電UPS智慧演化 做好用電管理更省成本
留言
顯示暱稱:
留言內容:
送出