การสนทนาสองชั่วโมงกับอันนักวิจัยค้นพบแบบจำลอง (AI) เพื่อสร้างแบบจำลองบุคลิกภาพที่ถูกต้อง
ในการศึกษาใหม่ที่เผยแพร่เมื่อวันที่ 15 พฤศจิกายนในฐานข้อมูลก่อนพิมพ์อาร์เอ็กซ์นักวิจัยจาก Google และมหาวิทยาลัยสแตนฟอร์ดได้สร้าง "ตัวแทนการจำลอง" ซึ่งโดยพื้นฐานแล้วคือแบบจำลอง AI ของบุคคล 1,052 คนจากการสัมภาษณ์สองชั่วโมงกับผู้เข้าร่วมแต่ละคน การสัมภาษณ์เหล่านี้ใช้เพื่อฝึกอบรมโมเดล AI เชิงสร้างสรรค์ที่ออกแบบมาเพื่อเลียนแบบพฤติกรรมของมนุษย์
เพื่อประเมินความแม่นยำของการจำลอง AI ผู้เข้าร่วมแต่ละคนได้ทำการทดสอบบุคลิกภาพ แบบสำรวจทางสังคม และเกมตรรกะครบสองรอบ และถูกขอให้ทำขั้นตอนนี้ซ้ำในอีกสองสัปดาห์ต่อมา เมื่อแบบจำลอง AI ผ่านการทดสอบเดียวกัน พวกมันจะจับคู่การตอบสนองของมนุษย์ด้วยความแม่นยำ 85%
งานวิจัยนี้เสนอว่าแบบจำลอง AI ที่เลียนแบบพฤติกรรมของมนุษย์อาจมีประโยชน์ในสถานการณ์การวิจัยต่างๆ เช่น การประเมินประสิทธิผลของนโยบายด้านสาธารณสุข การทำความเข้าใจการตอบสนองต่อการเปิดตัวผลิตภัณฑ์ หรือแม้แต่การสร้างแบบจำลองปฏิกิริยาต่อเหตุการณ์สำคัญทางสังคมที่อาจมีค่าใช้จ่ายสูงเกินไป ท้าทายหรือซับซ้อนทางจริยธรรมในการศึกษากับผู้เข้าร่วมที่เป็นมนุษย์
ที่เกี่ยวข้อง:
“การจำลองวัตถุประสงค์ทั่วไปของทัศนคติและพฤติกรรมของมนุษย์ โดยที่บุคคลจำลองแต่ละคนสามารถมีส่วนร่วมในบริบททางสังคม การเมือง หรือข้อมูลที่หลากหลาย อาจทำให้ห้องปฏิบัติการสำหรับนักวิจัยสามารถทดสอบการแทรกแซงและทฤษฎีชุดกว้าง ๆ ได้” นักวิจัยเขียนใน กระดาษ การจำลองยังสามารถช่วยนำร่องการแทรกแซงสาธารณะใหม่ๆ พัฒนาทฤษฎีเกี่ยวกับการโต้ตอบเชิงสาเหตุและบริบท และเพิ่มความเข้าใจของเราว่าสถาบันและเครือข่ายมีอิทธิพลต่อผู้คนอย่างไร
เพื่อสร้างตัวแทนการจำลอง นักวิจัยได้ทำการสัมภาษณ์เชิงลึกซึ่งครอบคลุมเรื่องราวชีวิต ค่านิยม และความคิดเห็นของผู้เข้าร่วมเกี่ยวกับประเด็นทางสังคม สิ่งนี้ทำให้ AI สามารถจับความแตกต่างที่การสำรวจทั่วไปหรือข้อมูลประชากรศาสตร์อาจพลาดไป นักวิจัยอธิบาย สิ่งสำคัญที่สุดคือ โครงสร้างของการสัมภาษณ์เหล่านี้ทำให้นักวิจัยมีอิสระในการเน้นสิ่งที่พวกเขาพบว่าสำคัญที่สุดสำหรับพวกเขาเป็นการส่วนตัว
นักวิทยาศาสตร์ใช้การสัมภาษณ์เหล่านี้เพื่อสร้างโมเดล AI ส่วนบุคคลที่สามารถคาดการณ์ว่าแต่ละบุคคลจะตอบสนองต่อคำถามแบบสำรวจ การทดลองทางสังคม และเกมเชิงพฤติกรรมอย่างไร ซึ่งรวมถึงการตอบสนองต่อแบบสำรวจสังคมทั่วไปซึ่งเป็นเครื่องมือที่มีชื่อเสียงในการวัดทัศนคติและพฤติกรรมทางสังคมสินค้าคงคลังบุคลิกภาพ Big Five- และเกมเศรษฐกิจ เช่นและเกมแห่งความไว้วางใจ-
แม้ว่าเจ้าหน้าที่ AI จะเลียนแบบมนุษย์อย่างใกล้ชิดในหลายด้าน แต่ความแม่นยำของมันก็แตกต่างกันไปในแต่ละงาน พวกเขาทำงานได้ดีโดยเฉพาะอย่างยิ่งในการเลียนแบบการตอบสนองต่อการสำรวจบุคลิกภาพและการกำหนดทัศนคติทางสังคม แต่มีความแม่นยำน้อยกว่าในการทำนายพฤติกรรมในเกมแบบโต้ตอบที่เกี่ยวข้องกับการตัดสินใจทางเศรษฐกิจ นักวิจัยอธิบายว่า AI มักจะต่อสู้กับงานที่เกี่ยวข้องกับพลวัตทางสังคมและความแตกต่างทางบริบท
พวกเขายังรับทราบถึงศักยภาพที่เทคโนโลยีจะถูกนำไปใช้ในทางที่ผิด เอไอ และ "“เทคโนโลยีกำลังเป็นอยู่แอบอ้าง ละเมิด และชักจูงบุคคลอื่นทางออนไลน์ นักวิจัยกล่าวว่าตัวแทนการจำลองยังสามารถนำไปใช้ในทางที่ผิดได้
อย่างไรก็ตาม พวกเขากล่าวว่าเทคโนโลยีสามารถช่วยให้เราศึกษาแง่มุมต่างๆ ของพฤติกรรมของมนุษย์ในรูปแบบที่ไม่เคยทำได้จริง โดยจัดให้มีสภาพแวดล้อมการทดสอบที่มีการควบคุมอย่างเข้มงวด โดยไม่มีความท้าทายด้านจริยธรรม ลอจิสติกส์ หรือความสัมพันธ์ระหว่างบุคคลในการทำงานกับมนุษย์
ในแถลงการณ์ถึงการทบทวนเทคโนโลยีของ MIT, ผู้เขียนนำการศึกษาปาร์ค จุนซองนักศึกษาระดับปริญญาเอกสาขาวิทยาการคอมพิวเตอร์ที่มหาวิทยาลัยสแตนฟอร์ดกล่าวว่า "หากคุณสามารถให้ 'คุณ' เล็กๆ น้อยๆ จำนวนมากวิ่งไปรอบๆ และทำการตัดสินใจตามที่คุณต้องการได้จริงๆ ฉันคิดว่านั่นก็คืออนาคตในท้ายที่สุด"