導讀:人類已經全面進入大數據時代。而醫(yī)療與大數據的“聯姻”一直被人們所期待,但遺憾的是大部分醫(yī)療數據仍處于“沉睡”狀態(tài)。
人類已經全面進入大數據時代。而醫(yī)療與大數據的“聯姻”一直被人們所期待,但遺憾的是大部分醫(yī)療數據仍處于“沉睡”狀態(tài)。如何真正進行實踐,讓大數據為醫(yī)生、為患者服務,賦能醫(yī)療新形態(tài),依然是擺在我們面前的一道難題。
【編者按】共享數據,才能更好地使用數據。如何將這些散落的、非標準化的、復雜的數據集合起來并可使用、可計算,還需做大量且復雜的工作……
如何將散落的、非標準化的、復雜的醫(yī)療大數據集合起來并可使用、可計算,需要做大量且復雜的工作。當然這并非不可能實現,但需要成本及時間。
人類已經全面進入大數據時代。而醫(yī)療與大數據的“聯姻”一直被人們所期待,但遺憾的是大部分醫(yī)療數據仍處于“沉睡”狀態(tài)。如何真正進行實踐,讓大數據為醫(yī)生、為患者服務,賦能醫(yī)療新形態(tài),依然是擺在我們面前的一道難題。
2016年,國務院發(fā)布《關于促進和規(guī)范健康醫(yī)療大數據應用發(fā)展的指導意見》,要求加快建設統一權威、互聯互通的人口健康信息平臺,推動健康醫(yī)療大數據資源共享開放;同年,《“健康中國2030”規(guī)劃綱要》提出,消除數據壁壘,建立和完善全國健康醫(yī)療數據資源目錄體系。2017 年,國務院發(fā)布《“十三五”深化醫(yī)藥衛(wèi)生體制改革規(guī)劃》,提出健全基于互聯網、大數據技術的分級診療信息系統;應用藥品流通大數據,拓展增值服務深度和廣度。
醫(yī)療大數據的應用早已突破診療過程,與整個健康體系密切相關,對藥物研發(fā)、健康管理和公共衛(wèi)生服務等環(huán)節(jié)都具有重要意義。如何實現各個專門數據庫與大數據平臺之間的聯通與配合,打通數據“孤島”,是擺在醫(yī)療大數據實踐面前的一道鴻溝。
北京大學腫瘤醫(yī)院院長、教授季加孚以美國和日本的案例對此進行了分析。他指出:“目前國際大型腫瘤數據庫大致分為兩類:基于人群的數據庫和基于醫(yī)院系統的數據庫。美國SEER(監(jiān)測、流行病學和結果)數據庫和日本癌癥登記數據庫屬于前者,而美國的NCDB(國家癌癥數據庫)和日本的NCD(國家臨床數據庫)屬于后者?!?br/>
比較來看,不同類型數據庫所能實現的效果不同。季加孚分析說:“基于醫(yī)院的數據庫,更符合臨床需求,可為患者診斷與治療提供更多有針對性的信息。但是這類數據庫存在就診偏倚,并不能很好地反映人口學分層的特點,例如NCDB和SEER數據庫在某些癌種的種族、年齡分布上存在差異?;谌巳旱臄祿炝餍胁W意義更加明確,能為國家戰(zhàn)略制定提供更多依據。通常兩種形式數據庫間的相互融合、數據共享能起到1+1>2的作用?!?/p>
那么不同數據庫之間是如何配合的呢?以日本NCD和癌癥登記數據庫為例,NCD主要收集詳盡的圍術期數據,而隨訪數據的積累一定程度上需依靠癌癥登記數據庫完成。由于《癌癥登記法》的強制性和廣泛覆蓋,腫瘤登記處會收集腫瘤患者的預后信息。這些信息會由登記處返回到提供信息的醫(yī)院,NCD即可通過醫(yī)院獲取腫瘤相關預后信息。
乳腺癌、胃癌、食管癌、肝癌等專病數據庫也逐步并入NCD。此外,NCD還和DPCD(日本診斷程序組合數據庫)等醫(yī)療保險數據庫互通,開展衛(wèi)生經濟學相關研究。與之類似,美國SEER數據庫與醫(yī)療保險合作,形成了SEER-Medicare數據庫。
在大數據領域從業(yè)近十年的架構師沈辰在接受采訪中告訴《中國科學報》,大數據具有所謂的“4V”屬性,即大規(guī)模(volume)、多樣性(variety)、產生和變化速度快(velocity)和價值密度低(value)。
“醫(yī)療大數據也是一樣,如何將這些散落的、非標準化的、復雜的數據集合起來并可使用、可計算,需要做大量且復雜的工作。當然這并非不可能實現,但需要成本及時間?!?br/>
南京醫(yī)科大學接受第二附屬醫(yī)院腸病中心主任張發(fā)明在采訪中提出,醫(yī)療行為過程中會產生大量的數據,而將這海量的數據進行處理,真正為醫(yī)療服務,大部分醫(yī)院目前不具備這樣的能力和經驗,需要大型數據服務商的支持。
上海第九人民醫(yī)院在2013年搭建了基于臨床數據倉庫(CDR)大數據集成平臺,其合作對象是微軟中國。通過對所有的業(yè)務數據庫的表單進行系統整合與深度挖掘,實現對醫(yī)院的內部運營管理、醫(yī)療質量控制、醫(yī)院感染管理、績效考核與分配等實時數據分析管理,并且整合了單病種臨床數據庫與樣本庫、基因庫關聯的臨床科研信息系統在臨床研究方面的應用。
杭州健培科技有限公司是一家從事醫(yī)學影像大數據挖掘和醫(yī)療人工智能技術的企業(yè),開發(fā)了閱片機器人“啄醫(yī)生”。董事長兼CEO程國華在創(chuàng)業(yè)初期就親身經歷過醫(yī)生與科技人員在思維與工作方式方法上的碰撞,他在采訪中告訴《中國科學報》:“醫(yī)療大數據的應用絕不單純是醫(yī)療領域的事情,而是一項跨學科的問題。”
專業(yè)人才的缺乏同樣也是擺在醫(yī)療大數據發(fā)展面前的難題。北京大學腫瘤醫(yī)院在2013年就開展了腫瘤登記及數據庫搭建工作,如今先后完成了基于電子病歷平臺的臨床科研一體化模式、數據綜合利用平臺及臨床試驗管理系統項目,這樣的成績離不開專業(yè)的醫(yī)療信息化團隊。
北大腫瘤醫(yī)院信息部主任衡反修是醫(yī)院搭建早期HIS系統的核心骨干,他認為,專業(yè)的技術背景和對醫(yī)療工作的深刻理解,才能真正“喚醒”醫(yī)療大數據。衡反修指出,對醫(yī)院來說:客觀存在“不敢、不愿、不會”三方面的問題,其中“不會”正是因為大數據必須要有技術支撐,沒有技術支撐就沒法兒對數據進行挖掘和利用。
他強調:“在數據共享開放過程中,技術、標準、機制、體制突破仍存在較大的障礙,造成各部門在推動過程當中‘不會’做。核心是數據能否做到安全可控,讓醫(yī)院放心?!?/p>
共享數據,才能更好地使用數據。程國華指出,盡管我們擁有海量的醫(yī)療大數據但是共享的程度很低,“沉睡”的大數據無法發(fā)揮作用。
“最直接的結果就是患者重復就醫(yī)、醫(yī)生重復看病、給患者重復做同樣的檢查等。這既給患者增加了沉重的負擔,延誤了治病的最好時機,又浪費了有限的醫(yī)療資源。從某種意義上可以說,這也是造成醫(yī)患矛盾的一個重要原因。更不用說醫(yī)務人員利用海量的醫(yī)療大數據進行科研,提高醫(yī)療水平了?!?/p>
大數據共享不易,重要原因正是出于對信息安全的擔憂。醫(yī)療數據是極為敏感的隱私信息,一旦發(fā)生泄露,后果極其惡劣。2018年新加坡保健集團健康數據遭黑客攻擊,150萬人的個人信息被非法獲取。新加坡總理李顯龍的配藥記錄、門診信息也遭到外泄,其他多名部長的個人資料和門診配藥記錄同樣被黑客獲取。這一時間直接導致新加坡所有的“智能國家”計劃暫停,包括強制性的“國家電子健康記錄”(NEHR)項目——該項目允許新加坡的醫(yī)院互相分享患者的治療記錄和醫(yī)療數據。
衡反修分析說:“不敢,正是因為數據共享、數據安全這些問題沒有解決,所以不敢去做。沒有規(guī)定,或者不太明確,不敢做?!?/p>
季加孚建議,對于大數據安全,可參考國際通用的健康保險攜帶和責任(HIPAA)法案對患者數據進行脫敏,保證患者數據隱私;采用加密強度較高的算法,確保數據存儲與傳輸的安全問題;參照國家信息安全等級保護,引進吸收國外醫(yī)療行業(yè)先進數據安全管理理念,實現傳統網絡安全與數據安全的融合。