不要放弃你的日常工作,因为一项新研究表明(AI)比你更有趣。
在一项旨在测试大语言模型(LLM)共同创造能力的新研究中,由平均而言,与人类创建的模型或由聊天机器人协助的人类创建的模型相比,模型被认为更有趣、更有创意、更易于分享。然而,当谈到顶级模因的质量时,人类产生的幽默仍然占主导地位。
在社交网络上评论结果蓝天,伊桑·莫里克宾夕法尼亚沃顿大学生成人工智能实验室教授兼联席主任表示:“我很遗憾地宣布模因图灵测试已经通过。”
有关的:
最初的图灵测试是由英国数学家于1950年提出的作为机器智能的基准:如果人类判断在对话中,机器可以说表现出了人类水平的智能。
虽然该研究没有评估人工智能生成的模因是否与人类制作的模因没有区别,但它确实提出了关于我们如何评估创造力的有趣问题——特别是当参与者通常对人工智能生成的内容给予更有利的评价时。
马赫梅学习
来自 KTH 皇家理工学院、慕尼黑大学和达姆施塔特工业大学的研究人员并没有打算展示人工智能的喜剧能力。相反,他们开始探索共同创造力,特别是法学硕士如何支持人类完成写笑话等创造性任务。
他们认为混合了文化参考、讽刺和低风险绩效压力的模因创作是完美的测试案例。迷因通常采用带字幕的图像形式,即兴发挥熟悉的情况或流行文化。它们已经成为一种共享的互联网速记,用于以易于理解且通常不敬的格式开玩笑或回应时事。
研究人员在论文中写道:“幽默的复杂性使其成为探索共同创造力动态的丰富领域,因为合作者必须驾驭这些细微差别,以产生与他人产生共鸣的内容。”
该实验涉及两个部分。第一个实验中,研究人员招募了 124 名参与者,并将他们分配到两组中的一组:一组单独工作,另一组与人工智能聊天机器人助手一起工作。
然后,参与者进行三轮,根据工作、食物和运动主题为经典模因模板生成标题,其中包括飞出个未来的弗莱,总督和波罗米尔(Boromir)(一个人并不是简单地走进魔多)模板。人工智能辅助组中的人员可以使用聊天机器人集思广益,但负责选择最佳想法并创建最终的模因。
仅由人类组成的团队创建了 335 个表情包,而 307 个表情包是由人类与人工智能混合团队制作的。 GPT-4o 还生成了另外 150 个模因用于比较。
第二组 98 人随后对这些模因的有趣性、创意性和可分享性进行了评分。这些模因是随机的,因此评估者不知道是谁或什么创造了它们。在所有三个类别中,人工智能生成的模因均名列前茅。
研究人员在论文中写道:“有趣的是,完全由人工智能创建的模因在所有领域的平均表现都优于纯人类和人类与人工智能协作的模因。” “然而,当审视表现最好的模因时,人类创造的模因在幽默方面表现更好,而人类与人工智能的合作在创造力和可分享性方面表现出色。”
换句话说,虽然人工智能生成的模因平均得分最高,但被认为“最有趣”的模因往往是由人类创建的。
内容再生
研究人员将人工智能的高平均分归功于以下事实:法学硕士接受了大量互联网内容的训练,这使他们擅长模仿广泛流行的幽默,但不太擅长说出真正的妙语。 “法学硕士吸引了广泛的幽默品味,但人类仍然可以更诙谐,”他们写道。
该研究还研究了人工智能辅助对生产力和感知努力的影响。使用聊天机器人的参与者比单独工作的参与者产生了更多的想法,但这并不总是转化为更有趣的内容。
研究人员表示,这是因为虽然法学硕士可以帮助产生创意,但它们不一定会提高创意质量的标准。对于幽默来说尤其如此,研究人员表示,幽默需要“时机、文化背景、共享知识和颠覆期望的能力”。
研究人员得出的结论是:“虽然法学硕士可以产生幽默且适合情境的模因,但他们在捕捉人类创造力固有的微妙文化参考和情感微妙方面经常面临挑战。虽然人工智能可以提高生产力并创造吸引广泛受众的内容,但人类创造力对于更深层次联系的内容仍然至关重要。”









