疫情來襲小命都不保了,大數據能幹嘛?!
巨量資料與資料科學如何應用本次疫情
以下整理四種醫療情境場景,帶大家一起看看資料科學怎麼應用在本次與未來的危機中。
美國時間4/3日,頂尖醫學期刊之一《JAMA》刊登了一篇論述臺灣針對新型冠狀病毒肺炎(COVID-19)防疫措施的報告,由史丹福大學臺裔醫師C. Jason Wang參與撰寫,文中特別指出臺灣在大數據、主動檢測等防疫上的應用,值得作為各國參考。 報告指出,臺灣與中國人民往來密切,在年節期間,臺灣國民健保資料庫和移民署海關資料彙集,串連國民之旅遊史與臨床症狀,以大數據分析技術建置即時監控與預警系統。自1月20日至2月24日止,由台灣疾管署 ( CDC ) 組織的中央疫情指揮中心已迅速執行至少124項行動,包括入境管制、風險溝通 ( 例:對民眾說明傳染病相關知識、進行衛生教育、與預防措施)、初級預防之政策規劃 ( 例:國內口罩資源分配方式與生產、制定各級學校的應變政策和企業補助等 )。 在全球疫情爆發的初期,台灣被視為全球疾病感染風險第二高的區域;但目前感染數字遠低於初期預測模型。展現了數據科學與醫療系統的即時融合與應用,乃為有效的初級預防工具。
接著我們也解此機會來看看幾種不同的大數據應用場境吧!
🔖場景一:自動化AI預警系統
加拿大新創公司 BlueDot 的AI預警系統於2019/12/30 發佈警告,並早於世界衛生組織一週通知其客戶,估算哪些亞洲城市可能會出現疫情。其AI系統透過監察全球航空公司的訂票系統,推估中國感染者會甚麼時候離境前往甚麼地方,結果準確預測出武漢肺炎擴散到泰國曼谷、韓國首爾、日本東京、以及台北等城市。 BlueDot 預警系統採用「自然語言處理(Natural Language Processing)」與「機器學習(Machine Learning)」等人工智慧技術,每天15 分鐘為週期更新資訊,抓取並分析當地和全球報紙上用65種語言發表的逾10萬篇新聞報道,加上WHO、CDC、等官方報告、國際航班資訊、人口統計資料、醫護人均比例等,世界各地政經數據,藉此追蹤全球100種傳染病的趨勢,並預測特定傳染病在某地區爆發的可能性。
波士頓波士頓兒童醫院所出資的HealthMap為美國哈佛醫學院與 MIT等團隊共同開發的一個平台,同樣在2019年12月底發出不知名肺炎的預警。透過整合網路上的多語系搜尋新聞資源,包含了Google News、百度、ProMed 與 WHO 的警示資訊,透過自動文字處理的流程,將新聞內容以地圖進行呈現。在網站中可以看到全球依照各種不同流行疾病、發生區域位置與發生時間點進行篩選與關注。
👉BlueDot 網址:https://bluedot.global/
👉Healthmap 網址:https://healthmap.org/zh/
👉相關報導網址:https://www.cnbc.com/…/bluedot-used-artificial-intelligence…
🔖場景二:資訊提供與疫情掌控
美國約翰霍普金斯大學(Johns Hopkins University)的系統科學與工程中心也特別製作了「全球武漢肺炎疫情儀表板」的平台來掌握疫情的最近進展。以及衛福部疾病管制署的疫情數據平台或是口罩販售地點與即時庫存等。
👉即時口罩資訊:https://mask.polstargps.com、https://yasco.com.tw/tw/mask.asp
👉CSSE @ Johns Hopkins University:https://gisanddata.maps.arcgis.com/…/opsdashboa…/index.html… 值得一提的17歲的美國西雅圖高中生Avi Schiffmann 也建立了一個疫情數據平台大家也可以上去比較看看,可以幫他買杯咖啡鼓勵一下。
👉Avi 的疫情數據平台:https://ncov2019.live/
🔖場景三:利用機器人執行特定的任務 衛福部疾病管制署與宏達電(HTC)合作開發推出疾管家Line@聊天機器人,透過醫療領域自然語言處理(Natural Language Processing, MNLP) 及人工智慧訓練語言互動能力提供海內外防疫、疫情現況與線上問答等資訊,除了提升資訊交流的便利性、正確性外也可減輕醫護人員負擔。
🔖 場景四:生物醫療上的應用 圖策智能(Graphen)研究來自30個國家,數百個武漢肺炎病毒的基因資料。3月10日,他和團隊比對每個病毒裡3萬個基因,終於完成全球第一個武漢肺炎擴散路徑圖。呈現這種病毒如何在短短3個多月竄出中國,還演化出亞型病毒,撲向世界的歷程。 台灣AILabs創辦人杜奕瑾級帶領基因團隊,利用「基因分析平台TAIGenomics」訓練的新冠病毒「老藥新用」數據平台,進行病毒與藥物分析,以利加速藥物開發。短短4天從美國FDA公告有結構的愛滋病藥物中,篩選出13個候選藥物,其中分數最高的瑞德西韋(remdesivir),與國際上公佈的有效治療新冠病毒肺炎用藥表單結果吻合。該結果2月17日就已經發表至Preprints平台上,甫公布至2月止,全球研發人士下載達6500次數。
👉Graphen相關報導:https://futurecity.cw.com.tw/article/1319
👉AILabs 相關報導:https://www.gbimonthly.com/2020/03/64932/ AILabs平台:https://covirus.cc/
🔖 其他應用場景包含各國醫療體系中導入協助醫療診斷的AI系統辨別系統、中國結合大量的鏡頭監控系統協助防疫、或是導入機器人在高感染風險區進行消毒等。
🔖 開源挑戰賽,Kaggle 組織了一個關於新冠病毒的開源研究數據集挑戰,透過大眾的力量一起尋找有關 CORD-19 的新發現。
👉 Kaggle 網址:https://www.kaggle.com/allen-ins…/CORD-19-research-challenge
👉 數據集:https://pages.semanticscholar.org/coronavirus-research