รหัสผ่านหลายพันรหัสใช้เพื่อฝึก CHATGPT และ AI อื่น ๆ

ข้อมูลที่ละเอียดอ่อนเกือบ 12,000 รายการเช่นคีย์ API และรหัสผ่านถูกค้นพบในคลังข้อมูลที่ใช้ทำให้เกิด AI เช่น CHATGPT การรั่วไหลนี้ทำให้เกิดความกังวลเกี่ยวกับความปลอดภัยของข้อมูลที่ใช้ในการฝึกฝนความฉลาดเทียม ...

ข้อมูลที่ละเอียดอ่อนเกือบ 12,000 ข้อมูลเช่นคีย์ API และรหัสผ่านถูกค้นพบภายในการรวบรวมข้อมูลทั่วไปโดยนักวิจัยของความปลอดภัยของทรัฟเฟิล- การรวบรวมข้อมูลทั่วไปคือชื่อของคลังข้อมูลขนาดใหญ่ของข้อมูลโอเพ่นซอร์ส รวบรวมตั้งแต่ปี 2008 ผ่านเว็บข้อมูลนี้ใช้โดยเฉพาะเพื่อฝึกอบรมโมเดล AI- ไจแอนต์อย่าง Openai, Deepseek, Google, Meta, มานุษยวิทยาและความเสถียรใช้ละครข้อมูลเพื่อสร้างแบบจำลองทางภาษาของพวกเขา (ภาษาโมเดลขนาดใหญ่หรือ LLM) ส่วนหนึ่งต้องขอบคุณข้อมูลเหล่านี้ที่ AI เป็นCHATGPTพัฒนาและเรียนรู้ที่จะตอบสนองต่อคำขอของผู้ใช้

"เราสงสัยว่าข้อมูลการระบุรหัสที่ยากสามารถนำเสนอในข้อมูลการฝึกอบรมซึ่งอาจมีผลต่อพฤติกรรมของแบบจำลอง"อธิบายความปลอดภัยของทรัฟเฟิล

อ่านเพิ่มเติม:CHATGPT ไปที่ระดับบนด้วย GPT-4.5 มันเปลี่ยนอะไร?

เกือบ 12,000 ข้อมูลที่เป็นความลับให้กับ AI

ตามที่นักวิจัยกล่าวว่ามีข้อมูล 400 teraoctes จาก 2.67 พันล้านหน้าเว็บที่เก็บรวมถึง11,908 ข้อมูลที่เป็นความลับ- การสแกนขึ้นอยู่กับทรัฟเฟิลฮอกเครื่องมือความปลอดภัยแบบโอเพ่นซอร์สที่ออกแบบมาเพื่อค้นหาข้อมูลที่ละเอียดอ่อนเช่นปุ่ม API รหัสผ่านหรือความลับอื่น ๆ

พวกเขาพบว่าตัวเองอยู่ในมือของความฉลาดเทียมในระหว่างการฝึกฝน การค้นพบนี้"ขีดเส้นใต้ปัญหาที่เพิ่มขึ้น: LLM ที่ได้รับการฝึกฝนในรหัสที่ไม่มีหลักประกันสามารถสร้างผลลัพธ์ความเสี่ยงได้โดยไม่ได้ตั้งใจ"- เห็นได้ชัดว่า AI สามารถเปิดเผยข้อมูลไม่ทางใดก็ทางหนึ่งและสร้างคำตอบที่มีข้อมูลที่ละเอียดอ่อน อย่างไรก็ตามมันจะถูกเรียกคืนว่าข้อมูลที่ใช้ในการสร้างแบบจำลองภาษาขนาดใหญ่จะถูกประมวลผลต้นน้ำเสมอ การประมวลผลนี้ทำให้สามารถทำความสะอาดข้อมูลได้โดยไม่รวมข้อมูลที่ซ้ำกันเป็นอันตรายหรือไร้ประโยชน์

ในบรรดาข้อมูลที่พบในคลังข้อมูลมีคีย์ API ที่ถูกต้องที่เสนอการเข้าถึงบริการเช่น Amazon Web Services (AWS) หรือ MailChimp นักวิจัยโดยเฉพาะอย่างยิ่งพบความฟุ่มเฟือยของคีย์สำหรับ MailChimp ซึ่งเป็นแพลตฟอร์มระบบอัตโนมัติสำหรับการส่งอีเมล

อ่านเพิ่มเติม:AI นี้สามารถตรวจจับมะเร็ง แต่เนิ่นๆโดยมองหาอนุภาคนาโนที่หายาก

ข้อผิดพลาดของนักพัฒนา

ตามที่อธิบายความปลอดภัยของทรัฟเฟิลในรายงานของ บริษัท นักพัฒนาทำผิดพลาดในการแทรกข้อมูลที่ละเอียดอ่อนโดยตรง (เช่นตัวระบุหรือปุ่ม API)ในรหัส HTML แบบฟอร์มและสคริปต์ JavaScript- บางปุ่มกลับมาหลายครั้งซึ่งเพิ่มความเสี่ยงสูงสุด

หลังจากการค้นพบของเขาความปลอดภัยของทรัฟเฟิลเข้ามาติดต่อกับทุกหน่วยงานรวมถึงกุญแจและรหัสผ่านพบว่าตัวเองอยู่ในมือของ AI ด้วยความช่วยเหลือของนักวิจัย บริษัท สามารถทำได้"ทัวร์/เพิกถอนหลายพันกุญแจรวมกัน"เป็นมาตรการความปลอดภัย

🔴อย่าพลาดข่าว 01NET ใด ๆ ติดตามเราGoogle NewsETWhatsapp-

แหล่งที่มา : ความปลอดภัยของทรัฟเฟิล

เกือบ 12,000 ข้อมูลที่เป็นความลับให้กับ AI

ข้อผิดพลาดของนักพัฒนา

相關貼文