很長時間以來,我國醫(yī)療大數據的發(fā)展都處于摸著石頭過河的狀態(tài)。醫(yī)院的數據基礎水平較差,應用能力相對薄弱,即使是在數據采集層面,也仍有很長一段路要走。
面對這樣的現狀,近兩年國家頻頻撥款,加大力度推動醫(yī)院信息化改造升級。
2017年9月,國家衛(wèi)計委批復了四川大學華西醫(yī)院、中國醫(yī)學科學院阜外醫(yī)院、北京大學人民醫(yī)院、復旦大學附屬兒科醫(yī)院4家醫(yī)院的大數據相關項目初步設計和投資概算共計6,771萬元。其中,中央預算內投資4,200萬元,其余資金由各醫(yī)院自籌解決。三級醫(yī)院信息化建設投資提速明顯。
現階段,國內三甲醫(yī)院的建設重心基本放在了信息集成平臺和互聯互通平臺上。為了落實《國務院辦公廳關于促進和規(guī)范健康醫(yī)療大數據應用發(fā)展的指導意見》,以及《健康中國2030規(guī)劃》,數據的結構化和質量,成為了醫(yī)院下一階段信息化建設的核心。
除了國家對數據的關注不斷加強之外,業(yè)內普遍也在數據層面頻頻發(fā)力。而之所以如此注重數據的結構化和質量,恰恰是因為今后醫(yī)療大數據能否從概念落實為實惠,數據基礎至關重要。
如果將2017年稱為醫(yī)療人工智能的元年,想必不會有多少人反對。業(yè)內評價人工智能公司的實力,往往會綜合算法、算力、數據三個方面的因素。
而圍繞這三要素的普遍共識是:算法難以成為企業(yè)未來的絕對核心競爭力,算力的高成本也絕非一般公司所能涉足,因此,數據成為了產業(yè)內各方競爭的焦點。
如何能夠保證原始數據的數據質量專業(yè)化、結構化及數據維度多樣化,讓未來開發(fā)具有真實性和準確性的人工智能變?yōu)榭赡??一家名為索聞博識的大數據公司,給出了自己的答案:“前結構化”+“專病種”。
前結構化比后結構化強在哪兒?
索聞博識的核心產品博識醫(yī)療云,是目前國內應用規(guī)模最大的專病種前結構化電子病歷平臺。目前已經有近500家三甲醫(yī)院、近4000個科室在使用基于博識醫(yī)療云平臺的應用。
過去,臨床醫(yī)生在進行科研工作時,往往花費98%的時間在整理病例和查找病歷上,僅有2%的時間能夠產生有效的科研價值。
在使用了基于博識醫(yī)療云的病種前結構化電子病歷服務之后,醫(yī)生可以節(jié)省95%的數據整理時間,從而讓他們可以把更多的時間放在對患者的診斷治療、科研和文章的細節(jié)上。
未來醫(yī)療人工智能的發(fā)展,最核心的一點便是高質量的結構化診療數據。要想獲取到這類數據,最優(yōu)的實現路徑則是基于專病電子病歷的前結構化錄入。
美國醫(yī)療信息化已經發(fā)展到以電子病歷為核心平臺,與其他業(yè)務單元進行整合,形成專病前結構化的大趨勢。美國的臨床醫(yī)生已基本普及利用前結構化記錄患者的信息,中國在這方面則遠遠落后。
目前,包括博識醫(yī)療云在內,國內仍有大量企業(yè)使用后結構化的方法處理存量信息 。但從本質來看,它只是中國醫(yī)療數據發(fā)展的一個過渡產物。
后結構化的優(yōu)點是作為當下一種主流的數據處理技術,能夠幫助醫(yī)院處理存量數據,從過往保留的海量病歷中導出結構化的數據,為醫(yī)生的臨床研究提供幫助。
它的缺點很明顯,主要有以下四點:
1、原始病歷內容缺失不完善,存量數據質量難以保證
2、需要集成院內各個系統(tǒng)實現數據的統(tǒng)一整理;
3、NLP等功能算法可重復使用性較低;
4、人工復核等企業(yè)運營成本極其高昂。
與后結構化相比,前結構化則有著以下幾點優(yōu)勢:
1、醫(yī)生能夠直接輸入主觀信息并實時上傳;
2、確保了數據從最初就以完善的內容和維度得以保存;
3、減少了數據處理的時耗及成本。
從后結構化過渡到前結構化,索聞博識也并非是一蹴而就。
從2013年開始,索聞博識團隊耗費了兩年的時間整理、開發(fā)、測試整個博識醫(yī)療云的原型技術體系;2015年,博識醫(yī)療云定位服務三甲醫(yī)院并開始推向市場,其中協(xié)和醫(yī)院胸外科是其極具代表性的客戶之一。
2015年時,協(xié)和醫(yī)院胸外科和其他三甲醫(yī)院胸外科醫(yī)院,還處于傳統(tǒng)HIS系統(tǒng)電子病歷配合紙質病歷的狀態(tài)。這對胸外科的醫(yī)生們造成了極大的困擾。
在與索聞博識接觸后,索聞博識基于自主核心技術,快速幫助協(xié)和醫(yī)院胸外科打造了一個完全符合診療路徑,同時凝聚了協(xié)和醫(yī)院胸外科臨床經驗的科室級專病種全結構化電子病歷。
在電子病歷平臺上線之初,索聞博識采用后結構化處理(文本抽提+NLP)的方法,把醫(yī)院過去5年歷史的患者存量信息從醫(yī)院系統(tǒng)里導出、清洗,并且導入到博識醫(yī)療云之中以便醫(yī)生更好使用。
但在對歷史信息的清理中,索聞博識團隊發(fā)現除了紙質媒體導入的不便之外,最為挑戰(zhàn)的是臨床醫(yī)生書寫的不均一性。不同醫(yī)生在措辭和用語方面的個性,給后期的自然語言處理帶來了巨大的挑戰(zhàn)。
如何破解這個難題?
在結合國外經驗以及產品論證后索聞博識發(fā)現,如果采用前結構化的方法,通過高度定制化全結構化表單,醫(yī)生通過點選和輸入數據的方式實現主觀診斷數據輸入,讓診斷結果直接生成,能夠有效克服不同醫(yī)生之間的語言差異,同時達到數據高質量地輸入。
2017年,基于醫(yī)院歷史資料處理的磨合,索聞博識為協(xié)和胸外科的醫(yī)生們量身設計了諸多操作細節(jié)和定制表單。臨床醫(yī)生們也越發(fā)體會到高度前結構化的電子病歷在書寫均一性上的優(yōu)勢。
經過一年多的臨床應用,協(xié)和胸外科的醫(yī)生們已經基本能將全部當期的住院患者信息用前結構化的方式記錄在博識醫(yī)療云中。當然,這在博識醫(yī)療云的客戶中并非個例。
專病電子病歷比普通電子病歷強在哪兒?
前結構化還有一個好處是:通過結構化的設計能讓電子病歷做到專病化。相對于傳統(tǒng)電子病歷,專病電子病歷在信息維度、數據質量、病種專業(yè)化、適于應用方面,均有著明顯優(yōu)勢。
在信息維度方面,專病電子病歷可以針對特定病種的信息,依照醫(yī)生需求做專門的采集,維度可以為1至無上限。泛病種病歷只收集病種普遍信息,在數據維度上限制極大。
數據質量方面,專病電子病歷僅針對該病種相關信息進行收集,超過80%的內容可以做到前結構化的定制,信息收集規(guī)范、統(tǒng)一。
在系統(tǒng)更新方面,專病電子病歷可根據疾病的指南和發(fā)展方向不斷更新迭代。而普通電子病歷無法因為某一個或幾個疾病的指南更新,藥物發(fā)展而及時更新。
適于應用方面,只有高質量高數量的專病信息才能總結疾病的治療情況,推動新藥的研發(fā),提高疾病的治療效果。專病信息的收集,甚至可以看做是人工智能的基石。
怎樣才能形成專病前結構化病歷?
要形成專病前結構化病歷,需要解決兩個核心問題,一是實現快速定制。三甲醫(yī)院之間,甚至是醫(yī)生之間并沒有太多共性化的需求,個性化需求偏多。醫(yī)院除了診斷治療外,還有大量的科研和疾病發(fā)展學科建設工作。
每家醫(yī)院在同一個疾病領域都有自己的經驗積累,在此基礎上才同時運行著不少具體的臨床科研項目。因此定制化對于三甲醫(yī)院的臨床科室來說,是一件非常重要的事情。
其二是能否快速迭代。以索聞博識三年來服務全國接近4000個三甲醫(yī)院臨床科室的經驗來看,醫(yī)院科室平均3-6個月便需要迭代一次電子病歷。
迭代內容包括醫(yī)生在使用過程中功能改進的建議,以及診療指南和研究方向的改變。而這種迭代往往并不是斷崖式的一次性更新,而是波浪式的持續(xù)累計下產生的質變。
總的來說,專病種電子病歷是前結構化電子病歷的前提。如果電子病歷做不到專病化,就一定無法做到結構化。
目前主流的電子病歷之所以是文本的形式,主要原因是醫(yī)院在信息化升級的過程中,需要考慮科室與科室之間的標準化問題。但實際上,這種標準化犧牲的是學科的專業(yè)化。
可以說,前結構化專病電子病歷能獲得最高質量的醫(yī)療數據,而高質量的醫(yī)療數據是人工智能模型訓練和算法應用的前提條件。
下面這個案例,能夠給出一些啟示。
專病前結構化電子病歷如何與人工智能相結合?
2017年,基于專病前結構化電子病歷的技術經驗,索聞博識開始嘗試在人工智能領域發(fā)力。
中國人民解放軍302醫(yī)院的肝臟腫瘤中心、中國研究型醫(yī)院學會分子診斷醫(yī)學專業(yè)委員會聯合博識醫(yī)療云于今年9月份發(fā)布了一項基于算法的成果:通過結合機器學習算法和臨床醫(yī)學方面的專業(yè)算法,打造了一款針對膽管細胞癌的診斷和生存概率的人工智能模型產品。
目的是希望能夠幫助更多的三級醫(yī)院、二級醫(yī)院的臨床醫(yī)生,準確地把膽管細胞癌從肝細胞癌中識別出來。
膽管細胞癌和肝細胞癌的生長部位都在肝區(qū),在影像上看起來很相似,但其實它們是不同源細胞,兩者的治療方案存在差別。能夠準確的識別和診斷膽管細胞癌并制訂合理的治療策略,對于患者具有巨大的意義。
EN的AUC峰值最優(yōu)
博識醫(yī)療云采用前結構化方法,首先先形成一個數千例的腫瘤數據集,該結構化數據集擁有近2000個字段維度。
首先通過機器學習算法將字段的維度快速降維,高效率的壓縮到合理的數量范圍內,從而滿足模型產品的易用性要求。
隨后結合醫(yī)學專業(yè)算法,利用機器學習模型獲取的關鍵變量信息進行擬合,最后非常成功地搭建出基于疾病的發(fā)病概率和一年生存期等核心輸出指標的人工智能產品。
從臨床醫(yī)生的角度,上述工作能夠幫助他們建立患者風險評價標準,未來有可能會內化到中國的膽管細胞癌診療指南中。
同時,博識醫(yī)療云這套模型算法不斷迭代更新內化到既有產品平臺中,包括網頁端和移動端,從而讓更多的臨床醫(yī)院通過公開的渠道使用該產品,應用到診斷和治療工作中。
毫無疑問,從篩選出腫瘤細胞,到給出診療意見,索聞博識的人工智能在影像學之外,又開辟了一個新的應用場景?;趯2∏敖Y構化電子病歷所建立的數據基礎。
在未來,索聞博識可以開發(fā)結合臨床醫(yī)生的需要,從機器學習、深度學習乃至復合型算法,實現更多場景的人工智能臨床應用。
文|郝雪陽
微信|hxy942416176
添加時請注明:姓名-公司-職位
后臺發(fā)送關鍵詞即可獲得相關好文
網站、公眾號等轉載請聯系授權
2016年,動脈網首次面向醫(yī)療健康產業(yè)發(fā)布了“2016年年度未來醫(yī)療100強榜”。
相較2016年,2017年的醫(yī)療健康產業(yè)將呈現怎樣的態(tài)勢?這些態(tài)勢是讓各領域的企業(yè)受益還是受阻?在2017年的未來醫(yī)療100強榜中,哪些領域的企業(yè)會上榜?哪些會落榜?……解開種種問題的鑰匙,就是長按識別上方二維碼。
近期推薦
★ 口腔:資本助力連鎖擴張,牙醫(yī)創(chuàng)業(yè)成為合伙人,數字化口腔已漸至成熟
★ 明醫(yī)眾禾宣布A輪融資6000萬元,剛成立2年,最近開始規(guī)?;瘡椭?/a>
★ 這位醫(yī)生用輕資產做母嬰健康咨詢,創(chuàng)業(yè)1年每月現金流過百萬,未來也要開診所
2017年年終盤點
★ 口腔:資本助力連鎖擴張,牙醫(yī)創(chuàng)業(yè)成為合伙人,數字化口腔已漸至成熟
★ 醫(yī)藥行業(yè):2017年有多項重磅政策落地,產業(yè)增長強勁、投資并購注重價值發(fā)現
★ 醫(yī)療大數據:基礎依然落后,2017年國家隊與人工智能企業(yè)入局,或將引發(fā)新一輪紅海爭奪
★ 醫(yī)療VR\AR:2017年僅一家公司融資,手術規(guī)劃導航、醫(yī)療教育的前景值得期待
★ 醫(yī)療信息化:2017年市場增長乏力,企業(yè)該如何尋找新的增長極?
★ 2017年中國醫(yī)療醫(yī)藥醫(yī)保政策匯總,全面解讀政策導向和監(jiān)管邏輯
聲明:動脈網所刊載內容之知識產權為動脈網及相關權利人專屬所有或持有。文中出現的采訪數據均由受訪者提供并確認。未經許可,禁止進行轉載、摘編、復制及建立鏡像等任何使用。
聯系客服