อย่ายอมแพ้งานประจำวันเพราะการศึกษาใหม่ชี้ให้เห็นว่า(AI) สนุกกว่าคุณ
ในการศึกษาใหม่ที่ออกแบบมาเพื่อทดสอบความสามารถร่วมสร้างของแบบจำลองภาษาขนาดใหญ่ (LLMs), memes อินเทอร์เน็ตที่สร้างขึ้นโดยโดยเฉลี่ยแล้วโมเดลนั้นมีความสนุกสนานมากขึ้นสร้างสรรค์และแบ่งปันได้มากกว่าที่มนุษย์สร้างขึ้นหรือโดยมนุษย์ด้วยความช่วยเหลือ Chatbot อย่างไรก็ตามเมื่อมันมาถึงคุณภาพของมส์อันดับสูงสุดอารมณ์ขันที่มนุษย์สร้างขึ้นยังคงได้รับชัยชนะ
ผลการวิจัยถูกอัพโหลด 20 มกราคมไปยังไฟล์arxivPreprint Server และนำเสนอในการประชุมนานาชาติครั้งที่ 30 เกี่ยวกับอินเทอร์เฟซผู้ใช้อัจฉริยะซึ่งเกิดขึ้นเมื่อวันที่ 24 ถึง 27 มีนาคมใน Cagliari ประเทศอิตาลี
แสดงความคิดเห็นเกี่ยวกับผลลัพธ์ในเครือข่ายโซเชียลบลูส์สกี้-อีธานมัลลิคศาสตราจารย์และผู้อำนวยการร่วมของห้องปฏิบัติการ AI Generative ที่ Wharton University of Pennsylvania กล่าวว่า: "ฉันเสียใจที่จะประกาศว่าการทดสอบ Meme Turing ได้ผ่านไปแล้ว"
ที่เกี่ยวข้อง:
การทดสอบทัวริงดั้งเดิมถูกเสนอในปี 2493 โดยนักคณิตศาสตร์ชาวอังกฤษเป็นมาตรฐานสำหรับหน่วยข่าวกรองของเครื่องจักร: หากผู้พิพากษาของมนุษย์ในการสนทนาเครื่องอาจกล่าวได้ว่าแสดงความฉลาดระดับมนุษย์
ในขณะที่การศึกษาไม่ได้ประเมินว่ามส์ที่สร้างขึ้นโดย Ai นั้นแยกไม่ออกจากสิ่งที่มนุษย์สร้างขึ้นมาหรือไม่
การเรียนรู้ของเครื่องจักร
นักวิจัยจาก KTH Royal Institute of Technology, LMU MUNICH และ TU DARMSTADT ไม่ได้ออกเดินทางเพื่อแสดงให้เห็นถึงความสามารถตลกของ AI แต่พวกเขาออกเดินทางเพื่อสำรวจความสัมพันธ์ร่วมกันโดยเฉพาะวิธีที่ LLMs สามารถสนับสนุนมนุษย์ด้วยงานสร้างสรรค์เช่นการเขียนเรื่องตลก
พวกเขาระบุการสร้าง MEME ด้วยการผสมผสานระหว่างการอ้างอิงทางวัฒนธรรมการเสียดสีและแรงกดดันประสิทธิภาพต่ำเป็นกรณีทดสอบที่สมบูรณ์แบบ Memes มักจะอยู่ในรูปแบบของภาพคำบรรยายภาพที่ riff ในสถานการณ์ที่คุ้นเคยหรือวัฒนธรรมป๊อป พวกเขาได้กลายเป็นชวเลขอินเทอร์เน็ตที่ใช้ร่วมกันซึ่งใช้ทำเรื่องตลกหรือตอบสนองต่อเหตุการณ์ปัจจุบันในรูปแบบที่ย่อยง่ายและมักจะไม่เคารพ
“ ความซับซ้อนของอารมณ์ขันทำให้เป็นพื้นที่ที่หลากหลายสำหรับการสำรวจพลวัตของความสัมพันธ์ร่วมกันเนื่องจากผู้ทำงานร่วมกันจะต้องนำทางความแตกต่างเหล่านี้เพื่อผลิตเนื้อหาที่สะท้อนกับผู้อื่น” นักวิจัยเขียนในบทความ
การทดลองเกี่ยวข้องกับสองส่วน ในครั้งแรกนักวิจัยคัดเลือกผู้เข้าร่วม 124 คนและมอบหมายให้พวกเขาเป็นหนึ่งในสองกลุ่ม: หนึ่งทำงานคนเดียวและอีกคนหนึ่งทำงานร่วมกับผู้ช่วย AI Chatbot
จากนั้นผู้เข้าร่วมจะได้รับสามรอบเพื่อสร้างคำอธิบายภาพสำหรับเทมเพลต meme คลาสสิกตามหัวข้อการทำงานอาหารและกีฬา - รวมถึงทอดจาก Futurama-ย่นและBoromir (ไม่เพียงแค่เดินเข้าไปในมอร์ดอร์)เทมเพลต ผู้ที่อยู่ในกลุ่ม Ai-Sistishes สามารถใช้ chatbot เพื่อระดมสมองแนวคิด แต่มีหน้าที่รับผิดชอบในการเลือกความคิดที่ดีที่สุดและสร้างมส์สุดท้าย
กลุ่มมนุษย์เท่านั้นสร้าง 335 มส์ในขณะที่ 307 ถูกผลิตโดยทีมไฮบริดของมนุษย์-เอ Memes เพิ่มเติม 150 Memes ถูกสร้างขึ้นโดย GPT-4O สำหรับการเปรียบเทียบ
กลุ่มที่สองของ 98 คนจากนั้นให้คะแนนมส์ว่าพวกเขาตลกสร้างสรรค์และแบ่งปันได้อย่างไร มส์ถูกสุ่มดังนั้นผู้ประเมินจึงไม่รู้ว่าใครหรืออะไรทำให้พวกเขา ในทั้งสามหมวดหมู่มส์ที่สร้างขึ้นโดย AI นั้นออกมาด้านบน
"ที่น่าสนใจคือมส์ที่สร้างขึ้นโดย AI ทำงานได้ดีกว่า Memes การทำงานร่วมกันของมนุษย์เท่านั้นและมนุษย์-AI ในทุกพื้นที่โดยเฉลี่ย" นักวิจัยเขียนไว้ในบทความ "อย่างไรก็ตามเมื่อมองไปที่มส์ที่มีประสิทธิภาพสูงสุดคนที่สร้างขึ้นมนุษย์นั้นดีกว่าในเรื่องอารมณ์ขันในขณะที่ความร่วมมือของมนุษย์-AI นั้นมีความคิดสร้างสรรค์และความสามารถในการแบ่งปัน"
กล่าวอีกนัยหนึ่งในขณะที่มส์ที่สร้างขึ้นโดยเฉลี่ยได้คะแนนสูงสุดโดยเฉลี่ย MEMES ระบุว่าเป็น "คนที่สนุกที่สุด" บ่อยกว่าที่มนุษย์ไม่ได้สร้างขึ้น
การฟื้นฟูเนื้อหา
นักวิจัยให้เครดิตคะแนนเฉลี่ยที่แข็งแกร่งของ AI ต่อความจริงที่ว่า LLMs ได้รับการฝึกฝนเกี่ยวกับเนื้อหาอินเทอร์เน็ตจำนวนมากทำให้พวกเขาสามารถเลียนแบบอารมณ์ขันที่ได้รับความนิยมอย่างกว้างขวาง แต่ไม่มากนักที่จะลงจอด “ LLMs ดึงดูดความสนใจในเรื่องอารมณ์ขัน แต่มนุษย์ก็ยังคงฉลาดกว่านี้” พวกเขาเขียน
การศึกษายังตรวจสอบผลกระทบของความช่วยเหลือ AI ต่อผลผลิตและความพยายามในการรับรู้ ผู้เข้าร่วมที่ทำงานกับ chatbot สร้างความคิดมากกว่าผู้ที่ทำงานคนเดียว แต่สิ่งนี้ไม่ได้แปลเป็นเนื้อหาที่สนุกกว่าเสมอไป
ตามที่นักวิจัยกล่าวว่าเป็นเพราะในขณะที่ LLM สามารถช่วยในการสร้างความคิดพวกเขาไม่จำเป็นต้องยกระดับคุณภาพความคิดสร้างสรรค์ นี่เป็นเรื่องจริงโดยเฉพาะอย่างยิ่งสำหรับอารมณ์ขันซึ่งนักวิจัยกล่าวว่าจำเป็นต้องใช้เวลา "เวลาบริบททางวัฒนธรรมความรู้ร่วมกันและความสามารถในการล้มล้างความคาดหวัง"
นักวิจัยสรุปว่า: "ในขณะที่ LLM สามารถสร้างมส์ที่มีอารมณ์ขันและเหมาะสมกับบริบทพวกเขามักจะเผชิญกับความท้าทายในการรวบรวมการอ้างอิงทางวัฒนธรรมที่เหมาะสมและรายละเอียดปลีกย่อยทางอารมณ์ที่มีอยู่ในความคิดสร้างสรรค์ของมนุษย์ในขณะที่ AI สามารถเพิ่มประสิทธิภาพการผลิตและสร้างเนื้อหาที่ดึงดูดผู้ชมในวงกว้าง