人工智能大脑活动解码器可以将思想转化为书面文字
想出一个故事——至少在某些时候——它就会出现。
将某人的大脑活动转化为书面文字听起来像是科幻小说中的梦想,但一种新的人工智能(德克萨斯大学奥斯汀分校开发的模型已经能够实现这一点。仅使用非侵入性扫描方法,该模型就可以被训练来长时间解码某人思想中的复杂语言。
“对于一种非侵入性方法来说,这是一个真正的飞跃,相比之前通常使用单个单词或短句的方法,”这项研究的共同负责人、神经科学和计算机科学助理教授 Alex Huth 在一篇陈述。
其他类似系统正在其他地方开发,但该系统的独特之处在于参与者不需要接受手术即可适合,也不会局限于他们可以使用的一个单词列表。
使用类似 Open AI 中的技术和谷歌的聊天机器人的模型(称为语义解码器)基于从个人那里获得的数小时数据进行训练,这些个人在收听播客的同时通过功能性磁共振成像 (fMRI) 扫描他们的大脑。之后,在参与者同意的情况下,他们可以在听新故事或想象讲故事时解码他们的想法,然后该模型将生成一串文本。
结果如下:
左侧显示参与者正在听的故事;右侧显示模型能够从他们的大脑活动中解码的内容。图片来源:德克萨斯大学奥斯汀分校
解码器无法逐字逐句地合成人的想法,但它通常可以捕捉到他们思考的要点。经过大量训练后,它能够生成文本,这些文本能够很好地、有时准确地表达出人们的想法,而这种情况大约有一半的时间是这样的。
这项研究并不仅限于听故事或思考故事。这段视频展示了模型能够从人们在观看关闭声音的电影片段时的大脑活动中解码出什么:
它可能并不完美,但整个过程都是非侵入性的,这是一个很大的优点。未来,希望这种技术的进一步发展可以帮助那些不再能够通过语言进行身体交流的患者,比如一些幸存者。
但是,如果看到这种技术让你感到不安,你并不孤单。对很多人来说,能够读懂你思想的设备更像是反乌托邦的噩梦,而不是科幻小说。
针对这些不可避免的担忧,研究联合负责人、博士生 Jerry Tang 表示,“我们非常重视这种技术可能被用于不良用途的担忧,并努力避免这种情况发生。我们希望确保人们只在需要时使用这些技术,并确保它能帮助他们。”
首先,从实际角度考虑,这个系统必须经过数小时的训练才能开始发挥作用。“一个人需要花上 15 个小时躺在 MRI 扫描仪里,保持完全静止,并全神贯注地听他们正在听的故事,才能真正发挥作用,”Huth 解释道。
除此之外,还有一个安全措施:即使是参与训练模型的人也可以通过思考一些不相关的东西(例如动物)来阻止模型解码他们的内心语言。
不过,随着研究人员继续努力推进这项技术,隐私和安全仍是重中之重。“我认为,虽然这项技术目前还处于早期阶段,但重要的是要积极主动地制定政策来保护人们及其隐私,”唐说。“规范这些设备的用途也非常重要。”
该研究发表于自然神经科学。