準(zhǔn)確的診斷在醫(yī)療保健中至關(guān)重要,它是獲得恰當(dāng)且及時(shí)治療的關(guān)鍵所在。近期,以 ChatGPT 為代表的大語言模型(large language model,LLM)在少樣本或零樣本學(xué)習(xí)方面展現(xiàn)出了令人矚目的能力,然而,它們在臨床診斷中的有效性,仍未得到證實(shí)。
2025年1月8日,北京郵電大學(xué)王光宇研究員聯(lián)合北京大學(xué)第三醫(yī)院宋純理教授、宜昌市中心人民醫(yī)院/三峽大學(xué)第一臨床醫(yī)學(xué)院楊簡教授,在 Nature Medicine 期刊發(fā)表了題為:A generalist medical language model for disease diagnosis assistance 的研究論文【1】。
該研究開發(fā)了一種用于疾病診斷輔助的通用大語言模型——MedFound。
在這項(xiàng)最新研究中,王光宇團(tuán)隊(duì)推出了一款名為 MedFound 的大語言模型,這是一款擁有 1760 億參數(shù)的通用醫(yī)學(xué)語言模型,其在來自不同醫(yī)學(xué)文本和真實(shí)世界臨床記錄的大規(guī)模語料庫上進(jìn)行了預(yù)訓(xùn)練。研究團(tuán)隊(duì)進(jìn)一步對 MedFound 進(jìn)行了微調(diào),采用基于自引導(dǎo)策略的鏈?zhǔn)剿季S方法來學(xué)習(xí)醫(yī)生的推理診斷,并引入了一個(gè)統(tǒng)一的偏好對齊框架,使其與標(biāo)準(zhǔn)臨床實(shí)踐保持一致。
廣泛的實(shí)驗(yàn)表明,在八個(gè)醫(yī)學(xué)??祁I(lǐng)域內(nèi),該醫(yī)學(xué)大語言模型在分布內(nèi)(常見疾?。⒎植纪猓ㄍ獠框?yàn)證)和長尾分布(罕見疾?。﹫鼍爸袃?yōu)于其他基準(zhǔn)大語言模型和專業(yè)模型。進(jìn)一步的消融研究表明,該醫(yī)學(xué)大語言模型訓(xùn)練方法中關(guān)鍵組件的有效性。
研究團(tuán)隊(duì)對大型語言模型(LLM)診斷的臨床適用性進(jìn)行了全面評估,包括人工智能(AI)與醫(yī)生的比較、人工智能輔助研究和人工評估框架。
該研究提出的框架納入了八項(xiàng)臨床評估指標(biāo),涵蓋了諸如病歷總結(jié)、診斷推理和風(fēng)險(xiǎn)管理等能力??偟膩碚f,這性研究結(jié)果表明,MedFound 模型在臨床工作流程中輔助醫(yī)生進(jìn)行疾病診斷方面是可行的。
診斷通用系統(tǒng)的開發(fā)與評估示意圖
MedFound 模型診斷案例:
對于上述病情描述,醫(yī)生診斷為急性支氣管炎,而 MedFound 模型診斷為慢性支氣管炎急性加重,醫(yī)生將診斷結(jié)果修正為慢性支氣管炎急性加重。
對于上述病情描述,醫(yī)生診斷為亞臨床甲狀腺功能減退,而 MedFound 模型診斷為自身免疫性甲狀腺疾病,醫(yī)生將診斷結(jié)果修正為自身免疫性甲狀腺炎。
王光宇研究員
王光宇博士,北京郵電大學(xué)研究員,曾獲2022年科學(xué)探索獎(jiǎng)。王光宇研究員長期致力探索智能醫(yī)學(xué)生物計(jì)算新理論方法及關(guān)鍵技術(shù),并取得了一系列國際前沿水平的研究成果。
2020年4月,王光宇等人在國際頂尖學(xué)術(shù)期刊 Cell 發(fā)表論文【2】,該研究利用CT數(shù)據(jù)開發(fā)了一款人工智能(AI)系統(tǒng),可用于診斷新冠肺炎,還能夠?qū)⑵渑c其他常見肺炎和正常對照區(qū)分開來,從而協(xié)助放射科醫(yī)生和內(nèi)科醫(yī)生進(jìn)行快速診斷,幫助臨床醫(yī)生對抗COVID-19。
2023年7月,王光宇等人在國際頂尖醫(yī)學(xué)期刊 Nature Medicine 發(fā)表論文【3】。該研究開發(fā)了一款人工智能(AI)預(yù)測系統(tǒng)——UniBind,該系統(tǒng)能預(yù)測 SARS-CoV-2 中有哪些突變株將對人類構(gòu)成重大威脅,有助改變?nèi)藗兎治?COVID-19 以及潛在的其他傳染病的模式和能力。
2023年9月14日,復(fù)旦大學(xué)附屬中山醫(yī)院李小英、陳穎團(tuán)隊(duì)聯(lián)合北京郵電大學(xué)王光宇團(tuán)隊(duì),在國際頂尖醫(yī)學(xué)期刊 Nature Medicine 上發(fā)表了題為:Optimized glycemic control of type 2 diabetes with reinforcement learning: a proof-of-concept trial 的研究論文【4】。
研究團(tuán)隊(duì)采用強(qiáng)化學(xué)習(xí)算法構(gòu)建了 2 型糖尿病的胰島素決策模型;并從計(jì)算機(jī)模擬效果、專家評估、真實(shí)世界患者療效評估,證實(shí)了該模型可制定個(gè)體化、精準(zhǔn)、動(dòng)態(tài)的胰島素治療方案,或?qū)⒆鳛闈撛诘挠行Чぞ咻o助臨床醫(yī)生管理 2 型糖尿病患者,減輕醫(yī)療負(fù)擔(dān),助力分級診療,賦能慢病管理。
論文鏈接:
1. https://www.nature.com/articles/s41591-024-03416-6
2. https://www.cell.com/cell/fulltext/S0092-8674(20)30551-1
合作咨詢
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com