自然的口語交流是瞬間完成的。超過幾秒鐘的言語遲緩就會打斷對話的自然流暢。這使得癱瘓者難以參與有意義的對話,從而可能會導致他們產(chǎn)生孤立和沮喪的感覺。
近年來,腦機接口(BCI)領域取得了許多突破性進展,例如,2023 年 8 月,加州大學舊金山分校張復倫(Edward Chang)團隊在 Nature 期刊發(fā)表論文【1】,通過新型腦機接口(BCI),將因腦干中風而嚴重癱瘓的患者在大腦中嘗試的無聲說話轉化為文字、語音和圖像,從而幫助嚴重癱瘓者恢復溝通能力。
然而,這種面相言語的腦機接口一般在患者嘗試無聲說話與計算機輸出之間會有幾秒鐘的延遲,這種延遲會在聆聽者與患者之間造成交流不暢和困擾。而一個實時系統(tǒng)有望恢復自然對話交流,或能提高失語患者的生活質量。
2025年3月31日,加州大學舊金山分校張復倫團隊與加州大學伯克利分校 Gopala Anumanchipalli 團隊合作,在 Nature Neuroscience 期刊發(fā)表了題為:A streaming brain-to-voice neuroprosthesis to restore naturalistic communication 的研究論文。
該研究開發(fā)了一種新型腦機接口設備,在 AI 模型訓練的幫助下,能夠將癱瘓失語患者大腦中想象的言語活動實時轉換成他的聲音輸出,從而幫助失語者恢復實時流暢交流的能力。
在這項研究中,研究體開發(fā)了一款無聲腦機接口,并作為一個臨床試驗的一部分,將它植入了一名 47 歲的四肢麻痹(四肢和軀干癱瘓)女性患者的大腦中,這名女性在一次中風發(fā)作后已有 18 年無法說話或發(fā)聲。
研究團隊讓她在大腦中用意念講出包含 1024 個獨特詞匯的完整句子,同時用她的大腦活動訓練了一個深度學習神經(jīng)網(wǎng)絡,這些大腦活動利用植入該患者言語感覺運動皮質的電極進行記錄。
研究團隊隨后使用該模型以 80 毫秒遞增的速度解碼在線語音,與受試者的發(fā)聲意圖同步,再生成用受試者受傷前說話片段訓練的模擬她聲音的音頻。這個腦機接口還可以推廣至該受試者訓練中沒有接觸過的詞匯,而且,該設備可以連續(xù)不間斷使用,而不是每次運行幾秒。
總的來說,這項研究引入了一種言語-神經(jīng)假體范式,有望恢復癱瘓失語患者的自然言語交流,讓他們更自然流暢地實時說話,從而提高他們的生活質量。
論文鏈接:
https://www.nature.com/articles/s41593-025-01905-6
合作咨詢
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com