英特爾和賓夕法尼亞大學醫學院正在研究一個龐大的、跨機構的人工智能,它將幫助識別腦瘤,但不會逾越嚴格的醫療隱私規則。這款跨機構人工智能將使用一種被稱為 “聯合學習 ”的技術,因為它跨越了29個不同的醫療和研究機構。
利用疾病數據集訓練人工智能,使其能夠讓大量的病例充當過濾器,這在很多方面都顯示出了有效的作用。然而,其缺點是,為了獲得最有效的性能,它需要的數據集必須相當可觀。單個醫療機構或研究實驗室可能會難以為正在開發的機器學習提供所需的所有信息。
賓夕法尼亞大學生物醫學圖像計算和分析中心(CBICA)的Spyridon Bakas博士解釋說:“機器學習培訓需要大量和多樣化的數據,盡管從技術上來講并不是什么挑戰,但現實是健康隱私法律(無論是HIPAA,GDPR還是其他法律)都限制了可以共享的內容,這是大數據處理的瓶頸。“
英特爾和賓夕法尼亞醫學院對此的答案是聯合學習。與其共享單個病人的記錄,不如將一個加密的機器學習模型分發到每個參與的機構中。它在每臺計算機上的安全區域中解密,并接受本地數據訓練。隨后僅將模型更新與負責匯總模型的組織共享。由于患者數據永遠不會離開單獨的機構,因此更具隱私化,同時重新訓練后的模型數據更小,因此在數據傳輸方面也更加高效。
賓夕法尼亞州醫學院和來自美國、加拿大、英國、德國、荷蘭、瑞士和印度的29家醫療和研究機構將利用這個運行在英特爾硬件上的聯合學習系統,合作研究出一種利用AI識別腦腫瘤的方法。今年,該聯盟將開始開發算法,從國際腦腫瘤分割(BraTS)數據集的大幅擴展版本中識別腦腫瘤。這個聯盟將允許醫學研究人員獲得大量的醫療數據,同時保護這些數據的安全性。
美國腦瘤協會表示,2020年將有近8萬人被確診為腦瘤。在原始MRI數據上訓練之后,當從掃描中識別膠質瘤腦腫瘤時,英特爾和賓夕法尼亞州醫學會開發的AI模型可以達到99%的準確率。