科技日?qǐng)?bào)記者 張夢(mèng)然
美國(guó)加州大學(xué)戴維斯分校團(tuán)隊(duì)開發(fā)出一種研究性腦機(jī)接口,有望幫助因神經(jīng)系統(tǒng)疾病而失去說話能力的人重新“發(fā)聲”。這項(xiàng)成果發(fā)表在最新一期《自然》雜志上,展示了該技術(shù)如何在人嘗試說話時(shí),立即將大腦活動(dòng)轉(zhuǎn)化為語音,從而創(chuàng)建出一種“數(shù)字聲帶”。
這項(xiàng)技術(shù)已在一名患有肌萎縮側(cè)索硬化癥(俗稱“漸凍癥”)的參與者身上測(cè)試成功。他通過植入式腦機(jī)接口,借助計(jì)算機(jī)與家人實(shí)時(shí)對(duì)話,不僅可以控制語調(diào),還能唱出簡(jiǎn)單的旋律。
此前的語音腦機(jī)接口主要將神經(jīng)活動(dòng)翻譯成文本,類似于發(fā)送短信,存在延遲并影響自然交流。而這種新型實(shí)時(shí)語音合成系統(tǒng)則更接近于語音通話,使用戶能夠更自然地參與對(duì)話。
新植入式腦機(jī)接口系統(tǒng)由4個(gè)微電極陣列組成,電極通過手術(shù)植入大腦中負(fù)責(zé)語音生成的區(qū)域。當(dāng)參與者試圖說話時(shí),電極記錄下神經(jīng)元的活動(dòng),并將信號(hào)傳輸?shù)酵獠坑?jì)算機(jī)進(jìn)行解碼,最終重建語音輸出。團(tuán)隊(duì)還開發(fā)了一種新算法,能將每一時(shí)刻的大腦活動(dòng)精確轉(zhuǎn)換為對(duì)應(yīng)的語音,參與者可通過調(diào)整音高來表達(dá)不同的情感或意圖,比如提問、發(fā)出感嘆或強(qiáng)調(diào)某個(gè)詞語。
新技術(shù)的速度非常快,從神經(jīng)信號(hào)采集到語音合成僅需1/40秒——這個(gè)延遲時(shí)間幾乎等同于人們正常說話時(shí)聽到自己聲音所需的時(shí)間。
參與者還能用該系統(tǒng)“唱”出簡(jiǎn)短的旋律,顯示出語音合成的靈活性。聽眾對(duì)合成語音的理解率達(dá)到近60%,而在不使用該系統(tǒng)的情況下,他的語音僅能聽懂約4%。
實(shí)現(xiàn)這一過程的關(guān)鍵在于先進(jìn)的人工智能算法。通過對(duì)數(shù)百個(gè)神經(jīng)元放電模式的分析,團(tuán)隊(duì)成功地將這些模式與參與者試圖產(chǎn)生的語音同步。這使得算法能在沒有語音輸入的情況下,僅憑神經(jīng)信號(hào)就準(zhǔn)確重建他想要表達(dá)的聲音。
這項(xiàng)研究標(biāo)志著腦機(jī)接口技術(shù)在恢復(fù)自然語言能力方面邁出的重要一步,為因疾病或損傷而失語的人群帶來了新的希望。未來,其有望應(yīng)用于更多患者,推動(dòng)神經(jīng)假體領(lǐng)域邁向更加智能化和人性化。
總編輯圈點(diǎn)
這項(xiàng)研究不僅實(shí)現(xiàn)了大腦信號(hào)向語音的實(shí)時(shí)轉(zhuǎn)換,更重要的是,它恢復(fù)了交流中的語調(diào)變化和節(jié)奏控制,使溝通更自然、更個(gè)性。相較于以前的輸出方式,明顯提升了交流效率與情感表達(dá),極大增強(qiáng)了使用者在對(duì)話中的主動(dòng)性和參與感。相信這項(xiàng)技術(shù)有潛力廣泛應(yīng)用于漸凍癥、中風(fēng)、腦干損傷等導(dǎo)致喪失語言能力的疾病治療中。同時(shí),隨著算法優(yōu)化和硬件小型化,還能拓展到更多神經(jīng)康復(fù)領(lǐng)域,甚至推動(dòng)人機(jī)交互邁向更智能化與人性化。