一直以來,我國醫療都存在醫生培養周期長,誤診率高,優質醫療資源供配不均等痛點,這使得看病難、看病貴已成不易根治的“頑疾”。而近兩年來,隨著人工智能走進醫療領域,醫療成了AI落地的又一萬億級場景,成為眾多企業競相涌入的風口,然而AI的賦能真的能有效地消除這些“頑疾”嗎?AI+醫療的痛點又在哪里呢?
五年前,IBM Watson高調進軍醫療領域,并于2015年實現Watson系統的商用,為醫院提供癌癥的輔助診療服務,成為全球AI醫療行業的領導者。然而近幾年,IBM Watson的發展并不如預期那般順利,2017年2月,休斯敦安德森癌癥研究中心(MD Anderson Cancer Center)終止了與IBM Watson的合作,稱其輔助診療效果始終達不到預期。2018年5月24日,IBM Watson又傳出對醫療部門大幅度裁員的消息,其背后暴露的問題不禁令人反思。
數據是AI醫療發展一大瓶頸
實際上,當人工智能打破了算法算力的技術壁壘之后,也愈發凸顯其對數據的依賴性,而Watson系統在醫療診斷時頻頻出錯的根本原因之一正是數據問題。雖然X光掃描識別惡性腫瘤并不算太難,但要制定出某種癌癥的治療方案是一件很復雜的事情,影像診斷需要經過大量專業醫師標注的數據進行模型訓練才行。但根據IBM的內部文件,Watson使用的訓練數據并不豐富,例如,訓練肺癌治療方案的數據僅有635例,況且這些數據并非全部來自真實患者,有些是來自合成的案例或假設的患者。
此外,北美對醫療數據有嚴格的隱私保護機制,并且每種疾病所需要的數據都不同,數據碎片化問題嚴重,這些因素便導致了數據獲取途徑困難且成本高昂。醫療數據成為了影像診斷行業發展的瓶頸。
而在我國,數據歸醫療機構和患者所共有,并且在2017年的《“十三五”全國人口健康信息化發展規劃》中,國家提出了要有序推動人口健康信息基礎資源大數據的開放和共享的政策方針。在政策支持下,三家醫療大數據公司也開始積極建設醫療數據庫,這給AI醫療的發展提供了很大的技術和數據支持。因此解決數據問題,是助推我國AI醫療實現彎道超車的關鍵點。
我國醫療大數據在質量上也不容樂觀
然而在我國醫療領域,作為AI醫療發展基石的醫療大數據在質量上也不容樂觀。
就電子醫療記錄而言,雖然目前醫院普及率很高,但其可及性和數據質量都并非最優,并且不同醫院使用的信息系統提供者達300多家,其數據結構和標準都有所差異。
除此之外,由于醫療資源分配不均衡,我國各地區醫生水平參差不齊,醫療欠發達地區的誤診率遠超一線城市,從而導致了整體疾病診斷正確率偏差很大。
“就像十年前我們討論用數據做知識研究的時候,中國面臨一個最大的問題就是中國的數據質量目前是不太可靠的,不可靠的原因就是疾病診斷不對。以我們拿到的北京中風病人數據為例,北京能夠收中風病人的醫院是130家,大概每年住院病人14萬人,診斷正確率是72%,另外的28%診斷都是錯的。”,北京天壇醫院王擁軍院長在GMIC生命科學如是說道。
我國醫療大數據之所以質量低下,一方面是因為高誤診率,另一方面則是因為缺乏標準化的臨床術語語義體系。雖然自2002年我國已采用了國際疾病編碼和國際手術編碼,但單憑這兩大術語并不能覆蓋醫療記錄中所有臨床信息,并且目前應用較為廣泛的醫學系統命名法在我國并不使用。因此只有做好醫學術語管理,才能挖掘出醫療大數據背后的真正含義。
除此之外,醫療大數據的隱私問題也不容忽視,但目前我國并無相關具體法律或指引,在不影響數據完整性的基礎上出臺隱私保護規則也很必要。
醫療大數據對人工智能在醫療領域的發展至關重要,在提高診斷準確性和優化臨床決策等方面發揮著巨大作用,我國AI醫療行業要想取得實質性發展,進一步完善數據系統,發展大數據收集、儲存、整合、管理和應用等各種新技術是關鍵一步。