ไม่ต้องสงสัยเลยว่าการดูความสนใจที่ได้รับการจ่ายให้กับอคติทางเชื้อชาติในการรับรู้ใบหน้าไบโอเมตริกซ์กลุ่มนักวิจัยมองการรับรู้การแสดงออกทางสีหน้าและพบปัญหาที่คล้ายกันกับอัลกอริทึมที่มีประสิทธิภาพที่เลวร้ายที่สุด
นักวิทยาศาสตร์พบว่ามีชุดข้อมูลขนาดใหญ่น้อยเกินไปที่ทั้งคู่มีวิชาที่หลากหลายและฉลากการแสดงออกที่เพียงพอ อัลกอริทึมการจดจำการแสดงออกไม่สามารถฝึกอบรมได้อย่างยุติธรรมและถูกต้องในสต็อกนี้
ระบบการจดจำการแสดงออกทางสีหน้าพยายามที่จะระบุอารมณ์ที่แสดงบนใบหน้าของผู้คนและเป็นงบน้อยกว่าวันนี้มากกว่าระบบการจดจำใบหน้าทั่วไป มีค่าโดยธรรมชาติที่กว้างขึ้น - สำหรับการระบุตัวตนเพียงอย่างเดียว - ในการสแกนใบหน้ามากกว่าที่จะเข้าใจอารมณ์
การสแกนคนเพื่อบันทึกอารมณ์ที่ชัดเจนของพวกเขามีแนวโน้มที่จะเป็นที่ถกเถียงกันมากกว่าชีวภาพอื่น ๆ และแม้แต่คำใบ้ของความไม่ยุติธรรมต่ออัลกอริทึมก็มีแนวโน้มที่จะทำให้คนที่ไม่สนใจแม้แต่คนที่ไม่สนใจมากที่สุดในสถานที่สาธารณะที่กำหนด
นักวิจัยสามคนจากมหาวิทยาลัยเคมบริดจ์ในสหราชอาณาจักรและหนึ่งในสี่จากมหาวิทยาลัยเทคนิคตะวันออกกลางในตุรกีที่ตีพิมพ์กระดาษที่ไม่ได้ตรวจสอบที่ไม่ได้รับการตรวจสอบในเดือนกรกฎาคม
การรับรู้การแสดงออกทางสีหน้าเป็นหัวข้อที่ได้รับการวิจัยอย่างดีตามที่นักวิจัย แต่ไม่ใช่การรับรู้การแสดงออกซึ่งพวกเขาอธิบายว่าเป็น "หายาก" และมี“ ชุดข้อมูลจำนวนมาก” ของใบหน้าที่มีฉลากนิพจน์
แต่“ แทบจะไม่มีชุดข้อมูลเหล่านี้มาจากการพิจารณาการกระจายที่ยุติธรรมทั่วประชากรมนุษย์” ทีมเขียน อีกวิธีหนึ่งแทบจะไม่มีความพยายามในการรวบรวมภาพและวิดีโอในชุดข้อมูลที่เกี่ยวข้องกับนิพจน์ที่ฉลากเชื้อชาติอายุและเพศ
AI ไม่สามารถจดจำโลกที่ไม่เคยเห็นมาก่อน
ในการพิสูจน์แนวคิดทีมใช้ฐานข้อมูล RAF-DB และ Celeba ซึ่งอธิบายไว้เป็นที่รู้จักกันดี ทั้งสองระบุอารมณ์หรือผลกระทบเช่นเดียวกับเพศอายุและเชื้อชาติ นักวิจัยยังพบว่าชุดข้อมูลทั้งสองนั้น“ มีขนาดใหญ่พอที่จะเปิดใช้งานการฝึกอบรมและการประเมินผลของแบบจำลองการเรียนรู้ลึกที่ทันสมัย
RAF-DB ถูกอธิบายว่าเป็นชุดโลกแห่งความเป็นจริงมีภาพถ่ายของใบหน้าที่รวบรวมจากอินเทอร์เน็ต มีประชากรผิวขาวที่มีอายุระหว่าง 20 ถึง 39 ปี จากนั้นถูกวาด 14,388 ภาพซึ่ง 11,512 ภาพถูกสุ่มตัวอย่างสำหรับการฝึกอบรม
ฐานข้อมูลนี้ใช้เพื่อรับรู้การแสดงออกเจ็ดประเภท: เป็นกลางความประหลาดใจความเศร้าความสุขความกลัวความรังเกียจและความโกรธ
Celeba ซึ่งมีภาพ 202,599 ภาพ 10,177 คนมีการแสดงออกที่มีป้ายกำกับที่เล็กกว่าและใช้ในการฝึกฝนเพื่อยิ้ม/ไม่ยิ้มเพศและอายุเท่านั้น
นักวิจัยใช้สามวิธีในการจัดเรียงนิพจน์: พื้นฐาน, คุณลักษณะที่ตระหนักถึงและแยกออกจากกัน
เป็นส่วนหนึ่งของผลลัพธ์ของพวกเขาพวกเขาพบว่าการใช้การเพิ่มข้อมูล (ซึ่งเพิ่มความหลากหลายของข้อมูลที่มีให้สำหรับแบบจำลองการฝึกอบรมโดยใช้เทคนิครวมถึงการครอบตัดภาพและการพลิก) ปรับปรุงความแม่นยำของโมเดลพื้นฐาน มันไม่สามารถบรรเทาอคติได้
แบบจำลองที่ตระหนักถึงคุณลักษณะและความไม่ลงรอยกันมีความแม่นยำและยุติธรรมกว่าพื้นฐานเมื่อพวกเขา“ เสริม” โดยการเพิ่มข้อมูล วิธีการที่ไม่หยุดยั้งนั้นดีที่สุดสำหรับ“ การลดอคติทางประชากร”
โดยรวมแล้วการลดอคตินั้น“ เหมาะสม” มากขึ้นเมื่อมีการกระจายแอตทริบิวต์ที่ไม่สม่ำเสมอหรือความไม่สมดุลในปริมาณของข้อมูลกลุ่มย่อย
หัวข้อบทความ
ความแม่นยำ-อคติไบโอเมตริกซ์-ไบโอเมตริกซ์-การวิจัยทางชีวภาพ-ชุดข้อมูล-การจดจำการแสดงออก-การจดจำใบหน้า-การฝึกอบรม