大規(guī)模蛋白質(zhì)組學(xué)研究能夠深化對健康和疾病的理解,但現(xiàn)有研究仍集中于有限的疾病結(jié)局,蛋白與健康和疾病之間的關(guān)系仍然存在許多未解之謎。疾病相關(guān)的蛋白質(zhì)是特異性的還是共同的?這些蛋白質(zhì)能否啟示疾病的生物學(xué)分類?它們能否作為疾病預(yù)測和診斷的生物標(biāo)志物及潛在的治療靶點(diǎn)?
2024年11月22日,復(fù)旦大學(xué)附屬華山醫(yī)院郁金泰、毛穎團(tuán)隊(duì)與復(fù)旦大學(xué)類腦智能科學(xué)與技術(shù)研究院程煒、馮建峰團(tuán)隊(duì)合作,在國際頂尖學(xué)術(shù)期刊 Cell 在線發(fā)表了題為:Atlas of the plasma proteome in health and disease in 53,026 adults 的研究論文。
這項(xiàng)研究全面繪制了人類健康與疾病蛋白質(zhì)組圖譜,并結(jié)合人工智能大數(shù)據(jù)分析方法,構(gòu)建了疾病診斷預(yù)測模型以及發(fā)現(xiàn)了26個(gè)藥物治療新靶點(diǎn),為精準(zhǔn)醫(yī)學(xué)的實(shí)施提供了重要科學(xué)依據(jù)。
該研究于2025年1月9日,登上了 Cell 期刊封面,該封面描繪了一個(gè)由蛋白質(zhì)構(gòu)成的人類,正在借助人工智能(由芯片和二進(jìn)制代碼代表)的幫助來檢查自己的健康狀況(通過心電圖監(jiān)測界面來體現(xiàn))。
封面圖片來自郁金泰、程煒
該研究的核心突破:
該研究通過深入分析53026名個(gè)體的血漿蛋白質(zhì)組數(shù)據(jù),納入了2920種血漿蛋白質(zhì)與406種既往患病、660種隨訪新發(fā)疾病以及986種健康相關(guān)特征,跨越了14.8年的中位隨訪期,揭示了168100個(gè)蛋白質(zhì)-疾病關(guān)聯(lián)和554488個(gè)蛋白質(zhì)-表型關(guān)聯(lián)。研究中發(fā)現(xiàn)超過650種蛋白質(zhì)與至少50種疾病存在聯(lián)系,而超過1000種蛋白質(zhì)表現(xiàn)出性別和年齡的異質(zhì)性,這些發(fā)現(xiàn)深化了對疾病間共享和特異分子機(jī)制的理解,揭示了不同人群在疾病易感性上的差異。
人類健康與疾病血漿蛋白質(zhì)組圖譜
研究團(tuán)隊(duì)發(fā)現(xiàn)免疫系統(tǒng)相關(guān)通路在絕大部分疾病中富集,強(qiáng)調(diào)了炎癥在人類健康中的重要作用。此外,對不同疾病之間的生物學(xué)通路的比較完善了對疾病病理生理學(xué)相似性和異質(zhì)性的理解。例如,阿爾茨海默?。ˋD)和血管性癡呆(VaD)相關(guān)的蛋白質(zhì)在與神經(jīng)系統(tǒng)相關(guān)的共同通路中富集,而AD特異性通路大多與脂質(zhì)代謝有關(guān),VaD特異性通路與心肌有關(guān)。傳統(tǒng)的疾病分類策略通常基于相似的臨床癥狀和表型特征,而忽略了共同的分子病因。利用蛋白質(zhì)組學(xué)特征對660種疾病進(jìn)行聚類,能夠根據(jù)其共享的生物學(xué)特性將這些疾病聯(lián)系起來,從而重新審視疾病的類別和亞型。例如,各種癡呆亞型被劃分到同一疾病亞群,該亞群還包含精神、內(nèi)分泌、心血管等系統(tǒng)疾病,基于此,研究團(tuán)隊(duì)進(jìn)一步揭示了該亞群的特征性生物學(xué)功能,將生物學(xué)上相關(guān)的疾病聯(lián)系在一起,有助于解釋為何患者身上會同時(shí)出現(xiàn)看似不相關(guān)的癥狀,并進(jìn)一步加深對機(jī)制的理解和提高治療的有效性。
血漿高通量測序蛋白質(zhì)數(shù)據(jù)存在復(fù)雜交互作用,往往難以單獨(dú)處理,而人工智能算法,能夠高效提取關(guān)鍵特征,構(gòu)建精確預(yù)測/診斷模型。研究團(tuán)隊(duì)利用機(jī)器學(xué)習(xí)等人工智能大數(shù)據(jù)分析技術(shù),識別出了具有潛在診斷和預(yù)測價(jià)值的生物標(biāo)志物,發(fā)現(xiàn)基于蛋白質(zhì)的模型在183種疾病中的AUC值超過0.80,明顯優(yōu)于基于人口統(tǒng)計(jì)學(xué)的模型,將有助于提高疾病的早期診斷率。
值得一提的是,GDF15被發(fā)現(xiàn)是預(yù)測和診斷多種疾病的關(guān)鍵蛋白,其在對200種疾病的預(yù)測中的重要度均排名榜首,這表明GDF15在疾病的早期識別和風(fēng)險(xiǎn)評估中具有重要作用,可能成為一個(gè)重要的生物標(biāo)志物。此外,EDA2R、NTproBNP、COL9A1和NEFL等蛋白也在多個(gè)疾病中表現(xiàn)出良好的預(yù)測和診斷性能,表明它們在多種生物過程中發(fā)揮著核心作用,具有廣泛的臨床應(yīng)用潛力。
對歷史藥物開發(fā)項(xiàng)目數(shù)據(jù)的評估顯示,有遺傳證據(jù)支持的靶點(diǎn)-適應(yīng)癥對在藥物開發(fā)中更有可能獲得成功。該研究通過整合蛋白質(zhì)數(shù)量性狀位點(diǎn)(pQTL)和疾病全基因組關(guān)聯(lián)研究(GWAS)數(shù)據(jù),使用孟德爾隨機(jī)化分析(MR)確定了474個(gè)具有潛在因果關(guān)聯(lián)的蛋白質(zhì)-疾病對。通過檢索DrugBank和Therapeutic Target Database中的藥物靶點(diǎn)信息以及進(jìn)行安全性評估,該研究提供了對25個(gè)已知靶點(diǎn)的37種潛在藥物重新利用機(jī)會,并確立了26個(gè)具有治療潛力且安全性良好的新靶點(diǎn),為老藥新用和新藥開發(fā)提供了重要線索。
為了進(jìn)一步推動科學(xué)研究和精準(zhǔn)醫(yī)療的發(fā)展,該研究建立了一個(gè)可開放訪問的蛋白質(zhì)組-表型組資源數(shù)據(jù)庫Proteome-Phenome Atlas(https://proteome-phenome-atlas.com/)。
這個(gè)數(shù)據(jù)庫不僅有助于科學(xué)家們更好地理解疾病的生物學(xué)機(jī)制,還將加速疾病生物標(biāo)志物、預(yù)測診斷模型和治療靶點(diǎn)的開發(fā),為精準(zhǔn)醫(yī)學(xué)的實(shí)施提供強(qiáng)有力的支持。
Proteome-Phenome Atlas數(shù)據(jù)庫首頁
總的來說,這項(xiàng)研究繪制的人類健康與疾病蛋白質(zhì)組圖譜揭示了血漿蛋白在疾病診斷、預(yù)測和治療中的潛在應(yīng)用價(jià)值。該研究為臨床實(shí)踐提供了科學(xué)依據(jù),有助于疾病的早期檢測、精準(zhǔn)分層和個(gè)性化治療。
未來,基于這一開放獲取的蛋白質(zhì)組學(xué)圖譜,研究人員將能夠更深入地探索疾病發(fā)病機(jī)制,推動生物標(biāo)志物和預(yù)測/診斷模型開發(fā),并探尋全新治療靶點(diǎn),為精準(zhǔn)醫(yī)學(xué)發(fā)展奠定了基礎(chǔ)。
論文鏈接:
https://www.cell.com/cell/fulltext/S0092-8674(24)01268-6
合作咨詢
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com