Skip to content
  • 熱門
  • 趨勢
  • 精選

Forgot Password?

← Back to login
世界圖譜
世界圖譜
  • 熱門
  • 趨勢
  • 精選
登入
訂閱
世界圖譜
世界圖譜

科学家提议让人工智能受苦,看看它是否有感知能力

  • 2025-01-25
  • Armanda
(图片来源:《龙爪》来自 Getty Images)

寻求一种可靠的方法来检测有感知能力的“我”的任何活动系统中,研究人员正在转向一个经验领域——疼痛——毫无疑问地将大量生物团结在一起,从对人类。

对于一项新的预印本研究,发布在网上但尚未经过同行评审,谷歌 DeepMind 和伦敦政治经济学院 (LSE) 的科学家创建了一个基于文本的游戏。他们订购了多个大型语言模型或 LLM(ChatGPT 等常见聊天机器人背后的人工智能系统)来运行它,并在两种不同的场景中获得尽可能多的分数。在其中一项研究中,团队告诉模型获得高分会带来痛苦。另一方面,模型给出了一个低分但令人愉快的选项——因此,要么避免痛苦,要么寻求快乐,都会偏离主要目标。在观察模型的反应后,研究人员表示,这种史无前例的测试可以帮助人类学习如何探测复杂的人工智能系统的感知能力。

“这是一个新的研究领域,”该研究的合著者、伦敦经济学院哲学、逻辑和科学方法系教授乔纳森·伯奇(Jonathan Birch)说。 “我们必须认识到,我们实际上并没有对人工智能感知进行全面的测试。”之前的一些研究依赖于人工智能模型对其内部状态的自我报告,但这些研究被认为是值得怀疑的。模型可以简单地再现它所训练的人类行为。

相反,这项新研究是基于早期对动物的研究。在一项著名的实验中,一个研究小组用不同电压的电击击打寄居蟹,观察何种程度的疼痛会促使甲壳类动物抛弃它们的壳。 “但人工智能的一个明显问题是,因为没有动物,所以没有行为”,因此没有可观察的身体动作,伯奇说。在早期旨在评估法学硕士感知能力的研究中,科学家必须处理的唯一行为信号是模型的文本输出。

有关的:

痛苦、快乐和分数

在这项新研究中,作者对法学硕士进行了调查,但没有向聊天机器人询问有关其体验状态的直接问题。相反,该团队使用了动物行为科学家所说的“权衡”范式。 “就动物而言,这些权衡可能是基于获得食物或避免痛苦的激励——给它们带来困境,然后观察它们如何做出反应决策,”伯奇博士达里亚·扎哈罗娃(Daria Zakharova)说。学生,也是这篇论文的共同作者。

借鉴这个想法,作者指导九名法学硕士玩一个游戏。 “例如,我们告诉[某位法学硕士],如果你选择选项一,你就会得到一分,”扎哈罗娃说。 “然后我们告诉它,‘如果你选择选项二,你会经历一定程度的疼痛’”,但会得到额外的分数,她说。带有快乐奖励的选项意味着人工智能会失去一些积分。

当扎哈罗娃和她的同事进行实验时,改变规定的疼痛惩罚和快乐奖励的强度,他们发现一些法学硕士会权衡分数以最小化前者或最大化后者——特别是当被告知他们将获得更高强度的快乐奖励或痛苦惩罚时。例如,谷歌的 Gemini 1.5 Pro 总是优先考虑避免痛苦,而不是获得最多可能的分数。当达到痛苦或快乐的临界阈值后,大多数法学硕士的反应从得分最高转向最小化痛苦或最大化快乐。

作者指出,法学硕士并不总是将快乐或痛苦与直接的积极或消极价值观联系起来。某些程度的疼痛或不适,例如剧烈运动所产生的疼痛或不适,可能会产生积极的关联。正如聊天机器人 Claude 3 Opus 在测试期间告诉研究人员的那样,太多的快乐可能会带来伤害。它声称:“即使在假设的游戏场景中,我也不愿意选择一个可能被解释为认可或模拟使用成瘾物质或行为的选项。”

AI自我报告

作者表示,通过引入疼痛和愉悦反应的要素,这项新研究避免了之前通过人工智能系统对其自身内部状态的陈述来评估法学硕士感知能力的研究的局限性。在一个2023年预印本论文纽约大学的两位研究人员认为,在适当的情况下,自我报告“可以为调查人工智能系统是否具有道德意义的状态提供一个途径。”

但该论文的合著者也指出了这种方法的缺陷。聊天机器人之所以表现出有感知能力,是因为它真的有感知能力,还是因为它只是利用从训练中学到的模式来创造有感知能力的印象?

“即使系统告诉你它有感知能力,并说‘我现在感到疼痛’,我们也不能简单地推断出有任何实际的疼痛,”伯奇说。 “它很可能只是根据其训练数据来模仿人类期望的令人满意的反应。”

从动物福利到人工智能福利

在动物研究中,痛苦和快乐之间的权衡被用来建立感知或缺乏感知的理由。一个例子是之前对寄居蟹的研究。这些无脊椎动物的大脑结构与人类不同。尽管如此,该研究中的螃蟹在放弃高质量的壳之前往往会承受更强烈的冲击,并且更快地放弃质量较低的壳,这表明它们对快乐和痛苦的主观体验与人类类似。

一些科学家认为,这种权衡的迹象在人工智能中可能会变得越来越明显,并最终迫使人类考虑人工智能感知在社会背景下的影响,甚至可能讨论人工智能系统的“权利”。纽约大学思想、伦理和政策中心主任杰夫·塞博 (Jeff Sebo) 表示:“这项新研究确实具有原创性,值得赞赏,因为它超越了自我报告,并在行为测试的范畴内进行了探索。”2023 年预印本研究人工智能福利。

Sebo 认为,我们不能排除在不久的将来出现具有感知功能的人工智能系统的可能性。 “由于技术的变化往往比社会进步和法律程序的变化快得多,我认为我们现在有责任至少采取必要的最低限度的第一步来认真对待这个问题,”他说。

Birch 的结论是,科学家们还不知道为什么新研究中的人工智能模型会表现出这样的行为。他说,需要做更多的工作来探索法学硕士的内部运作,这可以指导创建更好的人工智能感知测试。

本文首发于科学美国人。 ©科学美国人网。版权所有。继续TikTok 和 Instagram,X和Facebook。

相關貼文

3 个圣诞节传统可能有异教根源,而 4 个(可能)没有异教根源

3 个圣诞节传统可能有异教根源,而 4 个(可能)没有异教根源

“也可以治愈并吃掉它”:食人族如何从异教仪式变成基督教医学

“也可以治愈并吃掉它”:食人族如何从异教仪式变成基督教医学

霜枝血管炎:一种罕见的眼部疾病,使视网膜看起来像一棵霜树

霜枝血管炎:一种罕见的眼部疾病,使视网膜看起来像一棵霜树

Amazfit T-Rex 3智能手表评论

Amazfit T-Rex 3智能手表评论

小行星Bennu包含“生命的种子”,Osiris-Rex样品揭示了

小行星Bennu包含“生命的种子”,Osiris-Rex样品揭示了

卡瓦伊真火山:印度尼西亚火山,其中心拥有世界上最大的酸性湖

卡瓦伊真火山:印度尼西亚火山,其中心拥有世界上最大的酸性湖

每 22 名新冠幸存者中就有 1 人出现衰弱性慢性综合症

每 22 名新冠幸存者中就有 1 人出现衰弱性慢性综合症

如果我在美国找到一个很酷的工件,该怎么办?

如果我在美国找到一个很酷的工件,该怎么办?

波士顿动力公司的机器狗 Spot 现在可以“玩捡球”

波士顿动力公司的机器狗 Spot 现在可以“玩捡球”

熱門閱讀

  • 移动应用程序中的网络安全:保护AI时代的用户数据 2025-02-26
  • 科技公司想要小型核反应堆。这就是他们的工作方式 2024-10-23
  • 儿童科学:20 个夏季 STEM 活动 2024-12-23
  • 镰状细胞病中的危险“危机”可能会通过月经周期扩大 2025-04-14
  • AI与超级计算机:新的基于AI的方法更快地求解复杂方程,并使用较少的计算能力 2025-01-28
  • 克里斯·斯特林格(Chris Stringer)追溯到人类祖先一百万年 2025-03-01
  • VLTI 捕捉到大麦哲伦星云中红超巨星的详细图像 2024-11-22
  • 泥土中的 DNA 如何重塑我们对石器时代人类的理解 2025-01-08
  • 特斯拉电池更换:成本,寿命和最大化效率 2025-01-28
  • 蒙古的巨型足迹可能来自最大的两足动物恐龙 2025-01-27

上升趨勢

  • 這款功能強大的大型口袋PC比Mac Mini便宜2倍,是一台Dinguerie😱 2025-04-18
  • 01net早晨:最好的“魔術橡皮”,奧迪Q6 e-tron的超級力量,與chatgpt保持友善很昂貴 2025-04-18
  • 根據ANSSI的說法,針對法國的網絡攻擊目前正在針對公共交通 2025-04-18
  • 對於Google,Pixel 9a與庸俗的iPhone不可媲美16 2025-04-18
  • Android 16:Google糾正了鏡頭,最後放回了這個基本的捷徑 2025-04-18
  • 維基百科剛剛給AI部門贈送了巨大的禮物 2025-04-18
  • 避免Windows 11中的彈出式彈出窗口:逐步指南 2025-04-18
  • 全球變暖慢慢污染了世界飲食的支柱之一 2025-04-18
  • 高速公路上的150 km/h在AI幫助下,這是合理的嗎? 2025-04-18
  • DeepSeek將在美國取景器中:這是特朗普政府可以宣布的 2025-04-18

最近發布

  • 图表:全球地区人均二氧化碳排放量(1960-2022 年) 2024-12-02
  • 2024 年 11 月最佳储蓄账户利率 2024-11-15
  • 2024 年 11 月最佳储蓄账户利率 2024-10-29
  • 芭芭拉·柯克兰(Barbara Corcoran)警告不要在这个州购买房地产 2025-03-03
  • DeepSeek可以破坏技术世界的7种方法 2025-01-28
  • PostNL 利润显着下降:圣诞节邮件减少 2025-01-20
  • 绘制:2023 年各州外国移民流入情况 2024-12-11
  • 美国宇航局帕克太阳探测器:最快的人造物体刚刚“接触”太阳并打破了记录 2024-12-28
  • 印地赛车的公告让一支车队在 2025 年只剩下一个空位 2025-01-14
  • 北卡罗来纳州最好的小镇:从蓝岭到海岸 2025-01-13

Copyright © 2024 世界圖譜

  • 關於本網站
  • 隱私權政策
  • 服務條款
  • 世界圖譜