想像一個故事──至少在某些時候──它就會出現。
將某人的大腦活動轉化為書寫文字可能聽起來像是科幻小說中的夢想,但一種新的人工智慧()德州大學奧斯汀分校開發的模型已經能夠實現這一目標。 僅使用非侵入性掃描方法,就可以訓練該模型在較長時間內從某人的思想中解碼複雜的語言。
研究共同負責人、神經科學和電腦科學助理教授亞歷克斯·胡斯(Alex Huth) 在一份研究中表示:「對於非侵入性方法來說,與之前所做的通常是單字或短句子相比,這是一個真正的飛躍。陳述。
其他類似的系統也在其他地方開發,但這系統的與眾不同之處在於,參與者不需要接受手術即可獲得適合,也不限於他們可以使用的單字清單。
使用開放人工智慧中的技術和谷歌的在聊天機器人中,該模型(稱為語義解碼器)接受從個人收聽播客時獲得的數小時數據的訓練,同時透過功能性磁振造影(fMRI)掃描他們的大腦。 隨後,在參與者同意的情況下,他們可以在聽新故事或想像講故事的同時解碼自己的想法,模型將產生文字流。
結果看起來像這樣:
參與者正在聽的故事顯示在左側; 右邊是模型能夠從他們的大腦活動中解碼的內容。 圖片來源:德州大學奧斯汀分校
解碼器無法逐字合成人的想法,但它通常可以捕捉他們的想法的要點。 經過廣泛的訓練,它能夠產生大約一半時間能夠很好地、有時甚至準確地表達人們的想法的文本。
這項研究不僅限於聽到或思考故事。 該影片展示了當某人在關閉聲音的情況下觀看電影剪輯時,該模型能夠從某人的大腦活動中解碼出什麼內容:
它可能並不完美,但整個過程是非侵入性的,這是一個很大的優點。 未來,希望此類技術的進一步發展能幫助那些無法再透過語音進行身體交流的患者,例如一些患者。倖存者。
但是,如果看到這種技術讓您感到不安,那麼您並不孤單。 對許多人來說,能夠讀取你想法的裝置更像是反烏托邦的惡夢,而不是科幻奇幻。
針對這些不可避免的擔憂,研究共同負責人、博士生傑瑞唐 (Jerry Tang) 表示:「我們非常重視它可能被用於不良目的的擔憂,並努力避免這種情況發生。 我們希望確保人們只在需要時使用這些類型的技術,並且這對他們有幫助。
對於初學者來說,有一個實際的考慮因素,即該系統必須經過數小時的培訓才能開始工作。 「一個人需要花長達 15 個小時躺在 MRI 掃描儀中,保持完全靜止,並充分注意他們正在聽的故事,然後才能真正發揮作用,」Huth 解釋道。
除此之外,還有一個故障保護:即使是參與訓練該模型的人也可以透過思考一些不相關的事物(例如動物)來阻止模型解碼他們的內心言語。
儘管如此,隨著研究人員繼續努力推進這項技術,隱私和安全仍然是最重要的。 唐說:“我認為,雖然該技術目前還處於早期階段,但積極主動地制定保護人們及其隱私的政策非常重要。” “規範這些設備的用途也非常重要。”
該研究發表於自然神經科學。