两项新研究表明,Meta 的科学家们利用人工智能 (AI) 和非侵入性脑部扫描来揭示思想是如何转化为打字句子的。
在一项研究中,科学家开发了一种人工智能模型解码大脑信号重现志愿者输入的句子。在第二次研究,同样的研究人员使用人工智能来绘制大脑如何实际产生语言,将思想转化为输入的句子。
“这是解码的真正一步,尤其是非侵入式解码,”亚历山大·胡特德克萨斯大学奥斯汀分校的计算神经科学家没有参与这项研究,他告诉《生活科学》。
有关的:
使用类似解码技术的脑机接口已被植入失去沟通能力的人的大脑中,但新研究可能为可穿戴设备的潜在途径提供支持。
在第一项研究中,研究人员使用了一种称为脑磁图(MEG)的技术,该技术可以测量由大脑中的电脉冲产生,用于跟踪参与者输入句子时的神经活动。然后,他们训练了一个人工智能语言模型来解码大脑信号并从 MEG 数据中重现句子。
该模型对参与者输入的字母进行解码,准确率达到 68%。经常出现的字母被正确解码的频率更高,而不太常见的字母(例如 Z 和 K)的错误率更高。当模型犯错误时,它倾向于替换物理上接近 QWERTY 键盘上目标字母的字符,这表明该模型使用来自大脑的运动信号来预测参与者输入的字母。
该团队的第二项研究以这些结果为基础,旨在展示人打字时大脑中如何产生语言。当每个参与者输入几个句子时,科学家们每秒收集 1,000 个 MEG 快照。从这些快照中,他们解码了句子产生的不同阶段。
用人工智能解码你的想法
他们发现,大脑首先生成有关句子的上下文和含义的信息,然后随着参与者的输入,生成每个单词、音节和字母的越来越精细的表示。
作者在研究中写道:“这些结果证实了长期以来的预测,即语言产生需要将句子意义分层分解为逐渐较小的单元,最终控制运动动作。”
研究小组发现,为了防止一个单词或字母的表示干扰下一个单词或字母,大脑使用“动态神经代码”将它们分开。这段代码不断地改变每条信息在大脑中产生语言的部分的表示位置。
这使得大脑能够将连续的字母、音节和单词联系起来,同时在较长的时间内保留每个字母、音节和单词的信息。然而,脑磁图实验无法准确指出这些语言表征在这些大脑区域中出现的位置。
总的来说,这两项尚未经过同行评审的研究可以帮助科学家设计非侵入性设备,以改善失去说话能力的人的沟通。
研究人员写道,尽管目前的装置过于庞大且过于敏感,无法在受控实验室环境之外正常工作,但 MEG 技术的进步可能为未来的可穿戴设备打开大门。
“我认为他们确实处于方法的最前沿,”休斯说。 “就从这些信号中提取的内容而言,他们肯定正在尽我们所能利用当前技术做的事情。”









