醫(yī)藥投資:40萬億GB的醫(yī)療數(shù)據(jù),如何助力新藥研發(fā)?

今年5月,國家藥品監(jiān)督管理局藥品審評中心(CDE)發(fā)布《真實世界證據(jù)支持藥物研發(fā)的基本考慮》(意見稿),意味著“如何將真實世界證據(jù)(RWE)納入到我國藥物研發(fā)和監(jiān)管決策中”,開始成為監(jiān)管層正式思考以及著手推動解決的問題。


一時間,行業(yè)熱議:“RWE究竟能解決哪些臨床問題?RWS要整合哪些數(shù)據(jù)?RWD采集及處理流程是否留痕可追溯?其數(shù)據(jù)分析的方法學又是什么?”......


要回答這些直面從監(jiān)管到落地的“靈魂拷問”,讓真實世界證據(jù)真正“為我所用”,首先要解決的就是醫(yī)學數(shù)據(jù)庫的問題。


對此,在7月29日,中國生物統(tǒng)計2019年學術(shù)年會上,醫(yī)療大數(shù)據(jù)及人工智能企業(yè)零氪科技(LinkDoc)創(chuàng)始人兼CEO張?zhí)鞚梢浴拔覈t(yī)學數(shù)據(jù)庫現(xiàn)狀和挑戰(zhàn)”的議題,給出了來自行業(yè)一線探索和實踐者的思考和經(jīng)驗分享。

1564714297(1).jpg


產(chǎn)業(yè)需求是真正的驅(qū)動力量


“在過去一段時間,有幾種力量在驅(qū)動著醫(yī)學數(shù)據(jù)庫的發(fā)展。


首先是“技術(shù)驅(qū)動”。據(jù)IDC Digital預測,到2020年,醫(yī)療數(shù)據(jù)量將達40萬億GB,這是2010年的30倍。在過年十年時間里,醫(yī)療信息化迎來大發(fā)展,為人類沉淀了大量的“原始材料”,“就像未經(jīng)冶煉的原油”,而接下來醫(yī)療數(shù)據(jù)化的階段,是基于海量數(shù)據(jù)信息化,服務(wù)價值輸出的關(guān)鍵和必由之路。


其次是“政策推動”。2016年國務(wù)院辦公廳發(fā)布《關(guān)于促進和規(guī)范健康醫(yī)療大數(shù)據(jù)應(yīng)用發(fā)展的指導意見》,2017年又發(fā)布《關(guān)于促進“互聯(lián)網(wǎng)+醫(yī)療健康”發(fā)展的意見》,再到2018年國家衛(wèi)健委發(fā)布《國家健康醫(yī)療大數(shù)據(jù)標準、安全和服務(wù)管理辦法(試行)》……簡單梳理下來,三年左右時間里,國家累計發(fā)布30+政策文件,將健康醫(yī)療大數(shù)據(jù)納入國家大數(shù)據(jù)戰(zhàn)略布局,加速我國醫(yī)學數(shù)據(jù)資源共享利用。


最后,也是最重要的是“需求牽引”。


藥品研發(fā)與評價、醫(yī)藥營銷與流通、商業(yè)健康險、輔助診斷與輔助治療、基因數(shù)據(jù)分析、醫(yī)學專業(yè)繼續(xù)教育、臨床科研服務(wù)、藥品監(jiān)管、公共衛(wèi)生管理……在醫(yī)療的各個領(lǐng)域,數(shù)據(jù)都可以發(fā)揮巨大價值。“醫(yī)療數(shù)據(jù)平臺和資源,處于新醫(yī)療產(chǎn)業(yè)的樞紐位置,在個體化、精準診療的時代意義尤其巨大。


也正在這種強勁需求的牽引下,我國誕生了一些特定功能數(shù)據(jù)庫與特定人群數(shù)據(jù)庫,如醫(yī)學文獻數(shù)據(jù)庫、生物信息數(shù)據(jù)庫、臨床醫(yī)療數(shù)據(jù)庫、保險支付數(shù)據(jù)庫,等等。


“但產(chǎn)業(yè)的需求和牽引,其實才是真正的力量。

重大疾病藥物研究需求的大力牽引


今天,尤其在醫(yī)藥研發(fā)領(lǐng)域,這股牽引的力量正拉扯的愈發(fā)劇烈。


有數(shù)據(jù)顯示,腫瘤藥物I期到III期試驗的時間為9.6年,從首次申請專利到上市耗時10.5年,2018年每種腫瘤新藥的平均成本達到26億美元,研發(fā)成功率下降至8.0%。


“精準治療時代的到來,臨床試驗難度加大,患者入組難度加大,藥物研發(fā)的時間成本和財務(wù)成本顯著上升,而且藥物適用的患者人群非常細分、離散,臨床診療難度變高,患者管理難度變大。此外,適應(yīng)癥開發(fā)的競爭與商業(yè)的競爭,正在成為兩個平行的主戰(zhàn)場,中長期直接影響商業(yè)開發(fā)的潛力。


可以說,重大疾病藥物研究需求的快速增加,帶來專病數(shù)據(jù)庫的巨大需求。


在美國,ASCO就倡導和推動了北美多個腫瘤RWD數(shù)據(jù)平臺的發(fā)展,如CancerLinQ、Flatiron等。國際醫(yī)藥巨頭羅氏分別以21億和24億美元收購了?Foundation和Flatrion,以推動真實世界數(shù)據(jù)在醫(yī)藥研發(fā)中的應(yīng)用。從中可見一斑。


我國也一直在積極探索科研級醫(yī)學數(shù)據(jù)庫的建立。如,中國隊列共享平臺(China Cohort Consortium),但它的開放程度較低;全國腫瘤登記中心(National Central Cancer Registry),它的數(shù)據(jù)每年以報告形式來公布,而且不完全以臨床研究或者藥物經(jīng)濟學研究為目標建立。


整體而言,我國數(shù)據(jù)庫普遍缺乏以患者為中心的全景、長效數(shù)據(jù)。而可應(yīng)用于藥物研發(fā)的專病隊列要求病歷原件的完整度十分高,病歷原件不僅包括院內(nèi)數(shù)據(jù),還有院外數(shù)據(jù)。院內(nèi)數(shù)據(jù)又包括院內(nèi)信息系統(tǒng)數(shù)據(jù)以及科室沉淀數(shù)據(jù);院外數(shù)據(jù)則包括院外處方數(shù)據(jù)以及隨訪等數(shù)據(jù)。以NSCLC患者的病歷原件為例,需要包涵確診入院、手術(shù)、術(shù)后輔助治療、復發(fā)轉(zhuǎn)移、基因檢測、1~n線治療、生存數(shù)據(jù)等全流程數(shù)據(jù)。


“患者治病的過程,就像一個孩子在吃面包,面包屑掉了一地,就要跟蹤一路把這個面包屑收起來,這樣才可能產(chǎn)生高質(zhì)量科研級數(shù)據(jù)。

期待和現(xiàn)實的差距


所以,當真正撿拾起一塊塊的“面包屑”,拼接完整,價值就是巨大的。


在2018年世界肺癌大會上,法國Brest大學醫(yī)院的多中心、非干預的回顧性隊列研究,評估了真實世界中納武單抗治療伴腦轉(zhuǎn)移晚期NSCLC的顱內(nèi)有效性。研究結(jié)果顯示,免疫治療在合并腦轉(zhuǎn)移的NSCLC患者中顯示出非常有前景的療效。


在2019年4月4日,輝瑞乳腺癌新藥Ibrance基于真實世界數(shù)據(jù),獲批男性乳腺癌適應(yīng)癥,震動整個醫(yī)藥界。


看到真實世界數(shù)據(jù)在醫(yī)藥研發(fā)領(lǐng)域的潛力,2019年5月,CDE發(fā)布《真實世界證據(jù)支持藥物研發(fā)的基本考慮》(征求意見稿),確定了RWE在罕見病治療藥物、修訂適應(yīng)癥或聯(lián)合用藥范圍、上市后藥物的再評價、中藥醫(yī)院制劑的臨床研發(fā)、指導臨床研究設(shè)計、精準定位目標人群等場景中的應(yīng)用。引發(fā)行業(yè)熱議。


很多人在期待真實世界數(shù)據(jù)能解決行業(yè)的需求和痛點。


“然而……期待和現(xiàn)實,總是有一些差距。


在理想情況下,應(yīng)用真實世界數(shù)據(jù)經(jīng)過數(shù)據(jù)提取、模型建立,就直達深度學習、人工智能。而現(xiàn)實是,應(yīng)用真實世界數(shù)據(jù),需要跨過一個個溝溝壑壑,包括需求討論、提取數(shù)據(jù)、數(shù)據(jù)清洗、錯失值處理、特征工程、模型評估……

越過溝溝壑壑


如何才能越過真實世界數(shù)據(jù)應(yīng)用的溝溝壑壑?


“打造出真實、可信、可用的真實世界臨床數(shù)據(jù)庫,需解決病歷量大、非結(jié)構(gòu)化、隨訪困難、行業(yè)無標準、安全性等五大問題。


建立疾病模型是首要的,“給每一個疾病設(shè)定一個通用式疾病模型,一個基礎(chǔ)模型中有不同的域,每個域里有不同的變量,每個變量要設(shè)計出相關(guān)的約束。


接下來,可以利用人工+人工智能相結(jié)合的方式,對海量數(shù)據(jù)進行深度結(jié)構(gòu)化處理,可以數(shù)倍、數(shù)十倍甚至百倍地提高數(shù)據(jù)處理速度,大幅度降低數(shù)據(jù)處理成本,并保障質(zhì)量。在極為重要的隨訪數(shù)據(jù)集成過程中,如零氪(LinkDoc)基于算法分配隨訪任務(wù),隨訪數(shù)據(jù)與臨床數(shù)據(jù)實時打通,患者個人信息脫敏,隱私充分保護,實現(xiàn)全程100%錄音,隨訪成功率達80%+。


“做好數(shù)據(jù)的結(jié)構(gòu)化、隨訪,只是起點。”接下來還需要依據(jù)國際臨床研究CDISC標準 ,建立的數(shù)據(jù)處理流程,最終使得真實世界原始醫(yī)療數(shù)據(jù),轉(zhuǎn)化為科研級的標準數(shù)據(jù)庫。


同時,在數(shù)據(jù)庫的應(yīng)用過程中更要嚴格遵守“數(shù)據(jù)物理隔絕,訪問權(quán)限控制,應(yīng)用數(shù)據(jù)分層管理,患者知情授權(quán)”的規(guī)范化路徑。


基于這樣的真實世界數(shù)據(jù)庫,數(shù)據(jù)的價值就可以充分兌現(xiàn)。


高質(zhì)量的數(shù)據(jù)庫可以應(yīng)用于大型的臨床研究,助力中國癌癥新藥研發(fā);通過創(chuàng)新的模式,助力創(chuàng)新藥開展藥品重點監(jiān)測;建立多中心數(shù)據(jù)平臺,幫助專家在頂級學術(shù)期刊上發(fā)表高質(zhì)量的學術(shù)文章,等等。


最后,張?zhí)鞚烧J為,真實世界數(shù)據(jù)庫是基于臨床病歷,但遠遠不止于臨床病歷。“一個真實、可信、可用的臨床數(shù)據(jù)庫,需要清晰的目標、整體的設(shè)計、扎實的質(zhì)量控制,三者缺一不可。”或許也只有這樣,才可以回答那些“靈魂拷問”,讓真實世界證據(jù)真正為臨床診療、藥物研發(fā)及醫(yī)藥產(chǎn)業(yè)所用,讓真實世界研究真正落地。