位於美國的PAIGE.AI是一個致力於運用AI改變腫瘤學臨床診斷與治療的組織,最近,PAIGE.AI創辦人兼科技總監 Thomas Fuchs為Pure Storage提出證言,說明如何運用Pure Storage與NVIDIA共同打造的設備,發揮AI最大潛力。PAIGE.AI握有全世界最龐大的腫瘤病理學檔案庫,如何將這些PB等級的資料訓練出模型,辨別出腫瘤是他們致力達成的願景,藉由AI避免被誤診的情況、幫助病患在正確的時間獲得適合的藥物進行治療,或藉以延長生命。
這是一個典型運用人工智慧來實現精準醫療的案例,但卻不是只有特定國家才能加以實現。Pure Storage全球技術長Alex McMullan指出,人工智慧非常適合拿來尋找模型、趨勢、矛盾或是不應該存在的東西,企業只需要瞭解AI的好處與優勢,便能找出適合的應用。以台灣產業來說,由於台灣已推動電子病歷,在醫療產業會有很好的起始點,AI能有助於在X光片上面進行腫瘤判讀;而在金融服務業,就能用於金融風險的評估或是金融詐欺、金融詐騙的偵測;另外,也能利用機器學習進行網路監控、提出警告或是偵測駭客等,降低資料外洩風險。
他提到,機器學習成功的關鍵在於判斷或使用哪一些乾淨的數據,而這些數據可以帶來或者是產生哪些價值。對於剛入門的企業,不妨先從一小區塊但是非常乾淨有價值的資料開始做起,等到成功的時候再把它往外擴大,會是一個較容易將AI實現的策略方法。
多方案適應各種企業需求
近幾年,隨著人工智慧日益成熟,愈來愈多的企業開始評估、嘗試或導入相關的解決方案,並且結合內部數位轉型的策略,期盼能藉由AI帶來商業營運上的創新。然而要釋放AI優勢,光只有資料並不足夠,還必須具備能夠即時儲存與分析的基礎架構,以便讓資料科學家能夠專心地收集資料、清洗、探索,進而訓練模型。而基礎架構也必須要能夠依據資料的來源與管道,以及模型的複雜度進行擴展,從小規模一路擴展到超大規模的應用。
對此,Pure Storage自去年(2018)開始便加速產品線的布局,發表AI-Ready基礎架構(AIRI),今年3月,除了針對大型人工智慧應用發表適用超大規模的AI-Ready基礎架構,也與思科、NVIDIA合作推出FlashStack for AI解決方案。這其中,與NVIDIA及Mellanox合作開發的超大規模AIRI,可支援多機架NVIDIA DGX-1和DGX-2系統,同時具備InfiniBand與乙太網路兩種互連選項。而FlashStack for AI則是結合思科UCS伺服器與交換機、NVIDIA GPU以及Pure Storage FlashBlade儲存系統,能延伸現有的基礎架構來支援人工智慧/機器學習的工作負載,以避免產生新的基礎架構孤島。
Alex McMullan觀察,AI發展至今已經歷經數個鐘形曲線,這中間過程有崛起也有衰退,歷經好幾次AI寒冬。如今AI正在成為企業創新業務的關鍵。相較於五年前,資訊長對於新技術勇於創新採用的情況,今日的企業更重視投資報酬率(ROI)的表現,而這同時也會反應在解決方案上,亦即今日的解決方案必須要在總體成本(TCO)以及投資報酬率上展現出真正的價值,換言之,AI解決方案除了要能快速儲存大量資料之外,也必須快速地處理這些資料,這是非常關鍵的一點。
但是對於資料科學家而言,他們並不關心基礎架構,反而在意如何將分析工具的流程運行在這些架構上,「不少資料科學家都反映,他們幾乎有一半的時間都花在搬移資料或者是對資料進行清洗,真正能探索這些資料的時間卻很少。」他提到,這也是為什麼Pure Storage的AI解決方案受到企業採用的原因,因為研究人員與資料科學家不用再擔心基礎架構,不用等候數週到數個月才能啟動,只要專心在資料處理上,而這也是基礎架構最好的呈現方式。
用AI基建呈現企業生產力
根據MarketsandMarkets調查,全球人工智慧市場預計在2025年將達到1,906億美元,市場商機促使許多供應商的加入,在AI專屬基礎架構領域也是如此,除了像Pure Storage這類提供企業內部自建的解決方案供應商之外,雲端服務供應商也已提供基礎架構資源以及相關的演算法與套件,可以協助企業輕鬆地建構環境,此外,台灣身為ICT供應重鎮,白牌伺服器也很容易便能搭載NVIDIA GPU,提供企業作為AI的解決方案。
Alex McMullan坦承,企業現今確實有很多選項,但企業在投資時一定會思考,這筆投資的價值在何處或是投資報酬率為何?舉例而言,企業花費1,000萬來建置AI基礎架構,一定會希望這樣的架構,一天能運行12小時、24小時,而不是只有3小時就好,Pure Storage的架構可以全天24小時全天候的運行,不間斷地把資料丟給GPU處理,而這便是Pure Storage勝出的地方。
另外,相對於雲端解決方案,最大的不同則在於操作的簡易性,雲端服務供應商只負責提供使用者帳密、告知伺服器與GPU的資源所在位置,之後使用者就要自求多福了。Pure Storage之所以跟NVDIA合作,正是因為Pure Storage內部有資料科學家的團隊,並在平台上監控Pure Storage磁碟陣列裡面的狀況,然後發出警示,協助企業可以做更平順的運行。「把GPU提供給企業是一件很容易的事情,但是要如何把企業的生產力帶出來,才是一大重點。」
Pure Storage台灣區技術總監何與暉則補充說明,許多企業在導入AI的過程中經常發生瓶頸,這些已導入的運算及儲存方案因為無法橫向擴展,使得企業無法持續進行,因此企業一開始就選定對的架構非常重要,這也是為何Pure Storage會在市場上推出AI-Ready基礎架構的原因,企業可以由小做起,再慢慢擴展。而且在Pure Storage啟動AI專案也很容易,在NVIDIA GPU Cloud深度學習架構及Pure Storage AIRI Scaling Toolkit的支援下,AIRI能夠協助企業在最短數小時內便能啟動AI專案。