加利福尼亞的科學(xué)家們利用電極和人工智能制造了一種可以將大腦信號轉(zhuǎn)換成語言的裝置。他們說,他們實驗用的解碼器最終可能會發(fā)展為一種大腦
加利福尼亞的科學(xué)家們利用電極和人工智能制造了一種可以將大腦信號轉(zhuǎn)換成語言的裝置。他們說,他們實驗用的解碼器最終可能會發(fā)展為一種大腦植入物,屆時將能夠為因中風(fēng)、創(chuàng)傷性腦損傷、多發(fā)性硬化癥和帕金森氏癥等神經(jīng)系統(tǒng)疾病而失聲的人恢復(fù)說話的能力。
“這是一個令人興奮的技術(shù)證明,原則上有了這種技術(shù),我們應(yīng)該可以為失聲的病人建造一種臨床可行的設(shè)備,”加州大學(xué)舊金山分校(University of California, San Francisco)神經(jīng)外科教授、一篇描述該技術(shù)的論文的資深作者Edward Chang在一份聲明中說。
在他們的研究中,Chang和他的合作者記錄了5名癲癇患者(他們已經(jīng)在治療過程中植入了大腦植入物)大聲朗讀句子時的大腦活動,然后,一對神經(jīng)網(wǎng)絡(luò)——專門為識別模式而設(shè)計的人工智能算法——就會開始解碼過程。它們首先使用大腦信號來預(yù)測發(fā)送到嘴唇、舌頭、下巴和喉嚨的指令來產(chǎn)生單詞,第二步是把預(yù)測的動作轉(zhuǎn)換成計算機(jī)合成的語音。
為了測試計算機(jī)生成語音的可理解性,科學(xué)家們讓以英語為母語的人聽這些句子,然后讓他們從一堆單詞中選擇他們認(rèn)為聽到的單詞。而轉(zhuǎn)錄正確率取決于這些聽寫員參照的單詞數(shù)量,但平均而言,聽寫員能夠正確識別70%的單詞。當(dāng)每個單詞給定25個候選選項時,他們答對了69%的單詞;當(dāng)每個單詞有50個候選選項時,人們答對了47%的單詞。
其他科學(xué)家對這項研究表示贊賞,因為它關(guān)注的是產(chǎn)生語言所需的口腔運動,而不是特定的單詞或聲音。德國圖賓根大學(xué)(University of Tubingen)腦機(jī)接口實驗室的負(fù)責(zé)人安德爾·拉莫斯-穆吉亞爾德(Ander Ramos-Murguialday)在一封電子郵件中說,這種方法讓他們進(jìn)入了將思維轉(zhuǎn)化為運動的豐富研究領(lǐng)域。
腦機(jī)接口可以將大腦信號轉(zhuǎn)化為行動,比如在屏幕上移動光標(biāo),甚至駕駛無人機(jī)。此前,它們曾被用于幫助大腦癱瘓的患者——盡管速度只有每分鐘8個單詞(普通語音識別系統(tǒng)的速度約為每分鐘150個單詞)。
密歇根大學(xué)安娜堡分校大腦直接接口實驗室(University of Michigan Direct Brain Interface Laboratory)主任簡·哈金斯(Jane Huggins)沒有參與這項研究,但她說,研究人員的方法還可以平息人們的擔(dān)憂,即擔(dān)心個人的私人想法有可能會被機(jī)器讀出來。
她在一封電子郵件中說:“解碼與嘴部運動有關(guān)的大腦信號的好處是只解碼人們想說的話。因此,它將解碼其他類型大腦活動時可能出現(xiàn)的隱私泄露風(fēng)險降到了最低。”
但這種依賴嘴部運動的解碼器到底能不能幫助那些最需要它的人?那些因為患上中風(fēng)、肌萎縮側(cè)索硬化癥或其他疾病而無法移動嘴巴的人怎么辦?
“這些結(jié)果的主要局限在于它們不能像現(xiàn)在一樣應(yīng)用于沒有發(fā)音能力的患者身上,”拉莫斯-穆吉亞爾戴(Ramos-Murguialday)在電子郵件中說。換句話說,由于這項新研究的參與者都能正常說話,所以目前還不清楚這些算法將如何處理那些不能說話的人的大腦信號。
還有一個應(yīng)用電極的問題。和許多腦機(jī)接口一樣,實驗解碼器使用直接植入大腦的傳感器。除非科學(xué)家們找到另一種方法,否則這就意味著植入解碼器將需要先進(jìn)行腦部手術(shù)。
盡管有這樣的擔(dān)憂,Ramos-Murgulalday仍然稱這項工作是“非常有希望的一步”,在未來,有語言障礙的人可以很容易地進(jìn)行實時交流。
加州大學(xué)舊金山分校的研究生、該研究的合著者喬什·夏蒂爾(Josh Chartier)也持有相同提供的觀點。
他在一份聲明中說:“現(xiàn)在,不能移動胳膊和腿的人已經(jīng)學(xué)會用大腦控制機(jī)器人的肢體,而我們也希望有一天,有語言障礙的人能夠通過這種大腦控制的人工聲道重新學(xué)會說話。”