一直以來,研究人員在探索利用全基因組檢測或腦部掃描成像來診斷自閉癥,然而,這些努力成效已日漸微薄?,F(xiàn)階段,自閉癥的診斷仍依賴醫(yī)生基于經(jīng)驗的“臨床直覺”。這種“臨床直覺”中有著怎樣的邏輯?我們能否通過破解這一邏輯實(shí)現(xiàn)對自閉癥的更直接、更準(zhǔn)確的診斷?
近日,一項顛覆性研究通過大語言模型(LLM)解構(gòu)了 4000 多份自閉癥診斷病例報告,對報告中的專家醫(yī)生的“臨床直覺”的邏輯進(jìn)行了拆解和探索,得出了一個反常識結(jié)論——重復(fù)行為和特殊興趣才是自閉癥診斷的“黃金線索”,而非傳統(tǒng)認(rèn)為的社交缺陷。這一發(fā)現(xiàn)有望改寫已沿用數(shù)十年的自閉癥臨床診斷標(biāo)準(zhǔn)。
該研究以:Large language models deconstruct the clinical intuition behind diagnosing autism(大語言模型解構(gòu)自閉癥診斷背后的臨床直覺)為題,于 2025年3月26日發(fā)表在了 Cell 期刊,論文作者來自加拿大 Mila-魁北克人工智能研究所、麥吉爾大學(xué)。
基因和腦科學(xué)都失敗了,AI 何以破局?
過去 30 年里,科學(xué)家試圖從基因、腦成像中尋找自閉癥的“生物標(biāo)志物”,但收效甚微:
基因檢測準(zhǔn)確率僅 56%-71%,且存在種族偏差;
腦成像分析最高準(zhǔn)確率僅 70%,與拋硬幣相差無幾;
臨床診斷仍是金標(biāo)準(zhǔn),但依賴醫(yī)生的主觀判斷,缺乏統(tǒng)一依據(jù)。
自閉癥診斷的醫(yī)療報告中藏著醫(yī)生未明說的“臨床直覺”邏輯。如果我們能夠破解其中的邏輯,就能幫助更好地理解和診斷自閉癥。
因此,研究團(tuán)隊收集了 1080 名疑似自閉癥兒童(這些兒童來自一個具有廣泛地域代表性且人口眾多的群體)的 4272 份臨床診斷報告,利用“大語言模型”挖掘這些文字背后的診斷密碼。
AI 如何化身“診斷偵探”?
研究團(tuán)隊采用了一種基于 Transformer 的預(yù)訓(xùn)練大語言模型 RoBERTa,該模型共計 1.38 億個模型參數(shù),在 4.89 億個來自廣泛領(lǐng)域的文本語料庫的句子中進(jìn)行了預(yù)訓(xùn)練,然后針對專業(yè)領(lǐng)域進(jìn)行微調(diào),通過三步破解自閉癥診斷邏輯:
1、海量預(yù)訓(xùn)練+專業(yè)微調(diào):
模型先學(xué)習(xí)通用語言規(guī)律,再針對性分析自閉癥病例報告,捕捉“自閉癥相關(guān)語義”。
2、注意力機(jī)制:給關(guān)鍵句子“打高光”:
AI 內(nèi)置“熒光筆功能”,自動標(biāo)出報告中最關(guān)鍵的句子,例如:“患兒持續(xù)拍打雙手,對字母表異常專注”,對這些句子賦予高權(quán)重,而 “社交互動較少” ,則賦予低權(quán)重。
3、語義地圖比對:
將《精神障礙診斷與統(tǒng)計手冊-第五版》(DSM-5)診斷標(biāo)準(zhǔn)(例如“社交缺陷”、“重復(fù)行為”)轉(zhuǎn)化為語義向量,與 AI 標(biāo)注的“高光句子”比對相似度。
結(jié)果顯示:重復(fù)動作(B1)、特殊興趣(B3)、感知異常(B4)與自閉癥確診案例高度關(guān)聯(lián);而社交缺陷(A1、A2、A3)反而與非自閉癥病例更接近!
三、顛覆性發(fā)現(xiàn)
1、重復(fù)行為才是“真信號”:
“拍手(flapping)”、“重復(fù)語言(echolalia)”等詞匯在確診報告中的出現(xiàn)頻率比非病例高 21 倍;特殊興趣(例如對字母或數(shù)字的興趣)相關(guān)描述,在確診報告中的出現(xiàn)頻率比非病例高 14 倍。
2、社交缺陷可能是“煙霧彈”:
社交問題普遍存在于多動癥、語言障礙等疾病中,特異性低;語言模型發(fā)現(xiàn),醫(yī)生在確診時更依賴“看得見的行為”,而非模糊的社交描述。
3、DSM-5 標(biāo)準(zhǔn)該修訂了!
現(xiàn)行的自閉癥診斷標(biāo)準(zhǔn)包括 3 項社交標(biāo)準(zhǔn)和 4 項行為標(biāo)準(zhǔn),根據(jù)該標(biāo)準(zhǔn),滿足 3 項社交缺陷 + 2 項行為異??稍\斷為自閉癥。但該研究證明了行為異常(尤其B1/B3/B4)才是核心;而社交標(biāo)準(zhǔn)可能誤導(dǎo)診斷,尤其在低齡兒童中。
4、臨床直覺的“量化”:
該研究通過大語言模型量化了醫(yī)生的“臨床直覺”中潛藏的診斷邏輯,發(fā)現(xiàn)重復(fù)動作、特殊興趣以及感知異常比社交缺陷更能表明患有自閉癥,且該大語言模型的診斷準(zhǔn)確率高達(dá) 79.4%。
此外,這項研究不僅挑戰(zhàn)當(dāng)前的自閉癥診斷標(biāo)準(zhǔn),更為自閉癥的干預(yù)提供了新思路,例如,通過大語言模型進(jìn)行早期篩查,以更早識別自閉癥;利用自閉癥患兒的感知特點(diǎn)和特殊興趣設(shè)計個性化干預(yù)方法。
總的來說,這項研究表明,AI 不是要替代醫(yī)生,而是成為“超級助手”,將人類醫(yī)生的“臨床直覺”轉(zhuǎn)化為可解釋的科學(xué)模型。
論文鏈接:
https://www.cell.com/cell/fulltext/S0092-8674(25)00213-2
合作咨詢
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com