
不要放棄您的日常工作,因為一項新研究表明(AI)比您更有趣。
在一項旨在測試大語言模型(LLMS)共同創造功能的新研究中平均而言,模型比人類或通過聊天機器人協助的人類創建的更有趣,更具創造力和共享。但是,當涉及到最高的模因質量時,人類生成的幽默仍然佔上風。
調查結果於1月20日上傳到arxiv預印式服務器,並在3月24日至27日在意大利卡利亞里舉行的第30屆國際智能用戶界面會議上發表。
評論社交網絡上的結果布魯斯基,,,,伊桑·莫利克(Ethan Mollick)賓夕法尼亞州沃頓大學的生成AI實驗室教授兼聯合主任說:“我很遺憾地宣布,Meme Turing測試已經通過。”
有關的:
最初的圖靈測試是由英國數學家於1950年提出的作為機器智能的基準:如果人類法官在談話中,可以說該機器表現出人類水平的智能。
雖然該研究沒有評估AI生成的模因是否與人類製造的模因沒有區別,但它確實提出了有關我們如何評估創造力的有趣問題,尤其是因為參與者經常對AI生成的內容評為更有利的內容。
Macheme學習
來自KTH皇家理工學院LMU慕尼黑和Tu Darmstadt的研究人員並未著手展示AI的喜劇能力。取而代之的是,他們著手探索共同創造力,特別是LLM如何通過開玩笑等創意任務來支持人類。
他們將模因的創造與文化參考,諷刺和低風險性能壓力的混合在一起,是完美的測試用例。模因通常採用在熟悉的情況或流行文化上即興即興的圖像的形式。它們已成為一種共享的互聯網速記,用來開玩笑或以易於消化且通常不敬畏的格式響應時事。
研究人員在論文中寫道:“幽默的複雜性使其成為探索共同創造力動態的豐富領域,因為合作者必須導航這些細微差別以產生與他人共鳴的內容。”
實驗涉及兩個部分。首先,研究人員招募了124名參與者,並將他們分配給兩個小組之一:一個人獨自工作,另一個與AI聊天機器人助理一起工作。
然後,根據工作,食物和體育的主題(包括來自Futurama的Fry,,,,Doge和Boromir(一個不簡單地走進Mordor)模板。 AI輔助小組中的人可以使用聊天機器人來集思廣益,但負責選擇最佳想法並創建最終模因。
唯一的人群創造了335個模因,而307人是由人類混合動力團隊生產的。 GPT-4O產生了另外的150個模因,以進行比較。
然後,第二組98人將模因評為多麼有趣,富有創造力和可共享的模因。模因是隨機的,因此評估者不知道是誰或是什麼原因。在這三個類別中,AI生成的模因脫穎而出。
研究人員在論文中寫道:“有趣的是,完全由人工智學創造的模因表現得比所有領域的人類和人類合作模因的表現都更好。” “但是,在看最佳的模因時,人類創造的模因的幽默感更好,而人類的合作在創造力和共享性方面卻脫穎而出。”
換句話說,儘管AI生成的模因平均得分最高,但被確定為“最有趣”的模因通常是人類創造的。
內容再生
研究人員將AI的強大分數歸功於LLM的互聯網內容訓練,這使他們擅長模仿廣泛流行的幽默,但在降落真正的拳頭方面並沒有那麼多。他們寫道:“ LLM吸引了幽默的廣泛品味,但人類可能會更加聰明。”
該研究還研究了AI援助對生產力和感知努力的影響。與聊天機器人一起工作的參與者比單獨工作的參與者產生的想法更多,但這並不總是轉化為更有趣的內容。
根據研究人員的說法,這是因為儘管LLM可以幫助創意,但它們不一定會提高創作質量的標準。對於幽默而言,這尤其如此,研究人員說,這需要“時機,文化背景,共同的知識以及顛覆期望的能力”。
研究人員得出結論:“儘管LLM可以產生幽默且在上下文中適當的模因,但他們經常在捕捉人類創造力固有的細微文化參考和情感上的微妙之處方面面臨挑戰。儘管AI可以提高生產力並創造吸引廣泛受眾的內容,但人類的創造力仍然至關重要。