
不要放弃您的日常工作,因为一项新研究表明(AI)比您更有趣。
在一项旨在测试大语言模型(LLMS)共同创造功能的新研究中平均而言,模型比人类或通过聊天机器人协助的人类创建的更有趣,更具创造力和共享。但是,当涉及到最高的模因质量时,人类生成的幽默仍然占上风。
调查结果于1月20日上传到arxiv预印式服务器,并在3月24日至27日在意大利卡利亚里举行的第30届国际智能用户界面会议上发表。
评论社交网络上的结果布鲁斯基,,,,伊桑·莫利克(Ethan Mollick)宾夕法尼亚州沃顿大学的生成AI实验室教授兼联合主任说:“我很遗憾地宣布,Meme Turing测试已经通过。”
有关的:
最初的图灵测试是由英国数学家于1950年提出的作为机器智能的基准:如果人类法官在谈话中,可以说该机器表现出人类水平的智能。
虽然该研究没有评估AI生成的模因是否与人类制造的模因没有区别,但它确实提出了有关我们如何评估创造力的有趣问题,尤其是因为参与者经常对AI生成的内容评为更有利的内容。
Macheme学习
来自KTH皇家理工学院LMU慕尼黑和Tu Darmstadt的研究人员并未着手展示AI的喜剧能力。取而代之的是,他们着手探索共同创造力,特别是LLM如何通过开玩笑等创意任务来支持人类。
他们将模因的创造与文化参考,讽刺和低风险性能压力的混合在一起,是完美的测试用例。模因通常采用在熟悉的情况或流行文化上即兴即兴的图像的形式。它们已成为一种共享的互联网速记,用来开玩笑或以易于消化且通常不敬畏的格式响应时事。
研究人员在论文中写道:“幽默的复杂性使其成为探索共同创造力动态的丰富领域,因为合作者必须导航这些细微差别以产生与他人共鸣的内容。”
实验涉及两个部分。首先,研究人员招募了124名参与者,并将他们分配给两个小组之一:一个人独自工作,另一个与AI聊天机器人助理一起工作。
然后,根据工作,食物和体育的主题(包括来自Futurama的Fry,,,,Doge和Boromir(一个不简单地走进Mordor)模板。 AI辅助小组中的人可以使用聊天机器人来集思广益,但负责选择最佳想法并创建最终模因。
唯一的人群创造了335个模因,而307人是由人类混合动力团队生产的。 GPT-4O产生了另外的150个模因,以进行比较。
然后,第二组98人将模因评为多么有趣,富有创造力和可共享的模因。模因是随机的,因此评估者不知道是谁或是什么原因。在这三个类别中,AI生成的模因脱颖而出。
研究人员在论文中写道:“有趣的是,完全由人工智学创造的模因表现得比所有领域的人类和人类合作模因的表现都更好。” “但是,在看最佳的模因时,人类创造的模因的幽默感更好,而人类的合作在创造力和共享性方面却脱颖而出。”
换句话说,尽管AI生成的模因平均得分最高,但被确定为“最有趣”的模因通常是人类创造的。
内容再生
研究人员将AI的强大分数归功于LLM的互联网内容训练,这使他们擅长模仿广泛流行的幽默,但在降落真正的拳头方面并没有那么多。他们写道:“ LLM吸引了幽默的广泛品味,但人类可能会更加聪明。”
该研究还研究了AI援助对生产力和感知努力的影响。与聊天机器人一起工作的参与者比单独工作的参与者产生的想法更多,但这并不总是转化为更有趣的内容。
根据研究人员的说法,这是因为尽管LLM可以帮助创意,但它们不一定会提高创作质量的标准。对于幽默而言,这尤其如此,研究人员说,这需要“时机,文化背景,共同的知识以及颠覆期望的能力”。
研究人员得出结论:“尽管LLM可以产生幽默且在上下文中适当的模因,但他们经常在捕捉人类创造力固有的细微文化参考和情感上的微妙之处方面面临挑战。尽管AI可以提高生产力并创造吸引广泛受众的内容,但人类的创造力仍然至关重要。