AI

訓練AI投入臨床藥物開發 用機器學習拯救人命

2017-08-08
機器學習涵括各種臨床藥物開發者可以用來辨識並推斷模式的演算技術,支援強化的或自動決策過程。這類技術其中之一是「自然語言處理」,可用於「閱讀」科學文字,推斷語義脈絡,更方便地搜尋並查找資訊。

日常生活中經常會使用各式各樣的應用程式,透過其中蘊含的人工智慧,自動理解言詞,提供近乎即時的反饋,支援決策過程,就像是Siri。然而,機器學習作為諸多人工智慧技術之一,是否已經準備好臨床應用,尤其用來加速藥物開發以及減少開發成本呢?

答案是肯定的,因為機器學習與臨床醫療早已有些連結。機器學習涵括各種臨床藥物開發者可以用來辨識並推斷模式的演算技術,支援強化的或自動決策過程。這類技術其中之一是「自然語言處理」,可用於「閱讀」科學文字,推斷語義脈絡,更方便地搜尋並查找資訊。


▲機器學習與臨床醫療早已有些連結。機器學習涵括各種臨床藥物開發者可以用來辨識並推斷模式的演算技術,支援強化的或自動決策過程。(Photo : cBillionPhotos/Fotolia)

藉由機器學習,可以達到的目標包括:依據病人的病歷以及基因輪廓,預測他或她罹患某種疾病的傾向;依據某臨床實驗中心能否徵集到合適病人的歷史資料,預測接下來新實驗計畫成功徵集到病人的概率;找出與同一主題相關,有意義的科學文件叢集;透過質性、描述性資料,找出所有相似的病人團體。

演算法與大數據均為關鍵

機器學習和自然語言處理的主要優勢,在於能用來擴增或取代較容易出錯的人工分析,並且能隨著資料量與種類增加無限延展。機器學習(ML)是以一種演算方式,透過數學驅動的流程來處理結構性及非結構性歷史資料,並產出能夠辨認模式和脈絡意義的模型。這個過程需要資料輸入: .訓練機器學習演算法的資料組,以及用來做後續分析、更龐大的輸入資料組。

.標準醫學辭典,提供參考字詞定義。

.描述字詞關係的知識架構(Ontology)或文字註解。

.基於概率的數學模型,可以呼應「系統」將處理的輸入資料組種類予以訓練(例如科學文獻vs推特推文,兩者都有各異其趣的脈絡、語義和語言學特色)。

機器學習演算法會使用這些輸入,讀取資料組並萃取出字詞間的關係。此外,可以由專人確認這些字詞關係的精確性,並「細部訓練」演算法,讓它能達到甚至超越所謂相對精確的水平。

在訓練流程最後,機器學習的演算法會處理較大的輸入資料組並萃取出新的關係,針對關注的領域開啟更大的視野、更深入的了解。機器學習的一大優勢,即是在「大數據」資料組中游刃有餘的延展性。

舉例來說,甲骨文醫療科學中心(Oracle Health Sciences)的世界頂尖機器學習專家,在甲骨文實驗室內部與資訊檢索和機器學習事業群合作,應用機器學習在各種資料串流中找出新的藥物不良反應。

降低藥物開發風險

現在,資料的無窮可用性、人工智慧工具的可用性之間首次有了連結,開發人工智慧技術用於擴增各種現行人力為主活動的運算成本也非常低廉。 展望未來,以人工智慧為利基的資料科學將爆炸性成長,展現新能力。比方說,人工智慧技術有可能可以藉著找出資料間的新關係,找出新藥物選項。人工智慧可以處理科學文獻,同時在多篇文獻中融會貫通科學概念,兼顧質化和量化語義,從而找出新的藥物標靶。

執行臨床研究意味著要找出研究對象、召集加入並完成實驗,是藥物開發的一大瓶頸。人工智慧可以未卜先知,透過偵測趨勢和負面訊息優化這個過程。只須與人工智慧協同使用歷史表現資料,或許就能壓縮臨床藥物開發的關鍵過程,同時把風險極小化,最終降低成本。

如果可以藉由延伸人工智慧的潛能來支援決策過程,那麼就能想像成在臨床開發所有階段都有一個虛擬助理提供指引、全力支援的世界。 有一天,Siri不只會預告天氣,還會成為一個有診斷能力的臨床研究經理,在岌岌可危的實驗專案中改善參與人數──這絕非空想。

<本文作者為甲骨文醫學中心的產品策略總監,本文共同撰寫者包括 Pallika Kanani 以及John McLaughlin。>


追蹤我們Featrue us

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!