
研究人员Alex Huth,Shailee Jain和Jerry Tang(LR)准备了MRI机器以收集大脑活动数据。图片来源:奥斯汀的诺兰·桑克/德克萨斯大学
将某人的大脑活动转化为书面单词听起来像是一个科幻的梦想,但是一个新的人工智能()在德克萨斯大学奥斯汀分校开发的模型已经能够实现这一目标。仅使用非侵入性扫描方法,可以训练该模型在很长时间内从某人的想法中解码复杂的语言。
“对于一种无创方法,与以前所做的事情相比,这是一个真正的飞跃,这通常是单个单词或简短的句子。”陈述。
其他地方正在开发其他类似的系统,但是与众不同的是,参与者不需要接受手术即可安装,它们也不仅限于可以使用的单词列表。
使用在Open AI中看到的技术和Google的聊天机器人,该模型(称为语义解码器)经过了从个人聆听播客的数小时的数据进行培训,同时通过功能磁共振成像(fMRI)进行了大脑扫描。后来,在参与者的同意下,他们可以在听一个新故事或想象讲故事的同时解码自己的想法,该模型将产生文本流。
结果看起来像这样:

参与者正在听的故事在左边显示;右边是该模型可以从大脑活动中解码的方法。图片来源:德克萨斯大学奥斯汀分校
解码器无法综合一个人的想法,但通常可以捕捉他们的想法。经过广泛的培训后,它能够产生一个很好的,偶尔精确的文本,以表示该人的想法大约一半的时间。
这项研究不仅限于听到或思考故事。该视频显示了该模型在观看电影剪辑的情况下可以从某人的大脑活动中解码的内容,并显示了声音关闭的内容:
这可能不是完美的,但是整个过程无创的事实是一个很大的优势。将来,希望这样的技术进一步发展可以帮助那些无法通过语音进行身体沟通的患者,例如某些人幸存者。
但是,如果看这种技术会给您一种不安的感觉,那么您并不孤单。对于许多人来说,可以阅读您的想法的设备更像是反乌托邦噩梦的东西,而不是科幻幻想。
在解决这些不可避免的恐惧时,研究共同领导和博士生杰里·唐说:“我们非常认真地认为它可以用于不良目的并避免这种情况。我们希望确保人们只在愿意的时候就使用这些类型的技术,并且对他们有所帮助。”
对于初学者来说,有一个实际的考虑因素,必须对该系统进行数小时的培训,然后才能开始工作。 Huth解释说:“一个人最多需要在MRI扫描仪上花费长达15个小时,完全静止不动,并非常关注他们在此之前正在听的故事确实很好地效果。”
除此之外,还有一个故障保护:即使是参加训练模型的人也可以通过思考无关的东西(例如动物)来阻止其内部讲话。
尽管如此,随着研究人员继续努力进步这项技术,隐私和安全处于最前沿。唐说:“我认为,尽管该技术处于如此早期的状态,但通过制定保护人民及其隐私的政策来积极主动。” “调节这些设备可以使用的方法也非常重要。”
该研究发表在自然神经科学。