全球各地數千名科學家正努力不懈地對抗COVID-19疫情,包括尋找新療法和開發疫苗。數據分析領導廠商SAS開發出一項強大的資源:COVID-19科學文獻搜尋與文字分析,這個免費的視覺化文字分析環境運用人工智慧(AI)和機器學習,能快速搜尋數萬筆與COVID-19相關的研究文章,為科學家找到可能拯救生命的答案。
頂尖研究團隊攜手合作,在COVID-19開放研究資料集(COVID-19OpenResearchDataset,CORD-19)上公開超過5萬篇與COVID-19及其他冠狀病毒相關的科學研究全文。這些文章的主題包括治療成效、疫苗開發、防疫效果、基因分析、經濟衝擊等。有鑑於科學文獻數量龐大,要完全用人力來分析幾乎不可能,也並不實際。
史丹佛大學醫學教授暨COVID-19研究資料庫科學指導委員會主席Mark R. Cullen醫學博士表示,若要從科學文獻有效挖掘非結構化文字可能需要深入主題的專業團隊合作,才能省下大量時間,有效分類並確認資料相關性。
透過AI技術、自然語言處理、語言規則和複雜的模型技術,SAS開發出的COVID-19科學文獻搜尋與文字分析環境可快速又智慧地擷取CORD-19相關文字和數值資料。這項環境免費提供大眾使用,可透過自主引導的雲端系統,快速又有效地連結全球研究社群與最相關的科學文獻。
Cullen表示,SAS提供此解決方案,能加速研究流程並幫助全球各地的研究人員,協助他們對抗COVID-19疫情,例如得知治療成效,或深入瞭解新冠肺炎的基因變異。
有了SAS最新的視覺化文字分析環境,使用者能以互動方式探索冠狀病毒主題的相關研究,像是潛伏期、基因變異、風險評估等。他們也可以將擷取的關鍵字視覺化並概述量化資料,透過視覺化關聯網絡分析功能,迅速找出共同引用和發表文章的學術機構,還能在免費文章中針對關鍵詞進行搜尋。
SAS Viya能透過進階分析功能和AI方法來加強互動式環境,協助研究人員有效運用CORD-19資料集。透過SAS視覺化文字分析和SAS視覺資料探勘與機器學習,SAS在資料集中加入了語言學家和衛生及生命科學專家所開發的模型。研究人員還能探索更多主題,例如個人防護裝備功效、社交距離成效和病毒散播環境等。這些模型也會擷取量化資料並將其視覺化,內容包括潛伏期和COVID-19的再生數。
SAS工程部資深副總裁BryanHarris表示,SAS投入尖端科技的創新運用,協助各個產業的客戶對抗大流行。我們最新的AI環境超越了市場現有的產品,提供直覺而視覺化的方式,找出研究中存在的複雜關聯。由於我們並不是單單倚賴機器學習,同時也運用人為干預的方法,因此使用者可以檢視少部分不同的資料,找到他們實際上需要的內容,以支援各自的研究需求。
此外,SAS推出COVID-19資訊站,內含免費分析模型、監測流行病傳播的公共儀表板、內建在SASViya的資料探索環境,以及免費的訓練資源。