AI: Anthropic ถูกกล่าวหาว่ารวบรวมเนื้อหาเว็บไซต์โดยไม่ได้รับอนุญาต

Claude บริษัท AI สัญชาติอเมริกันซึ่งเปิดตัวคู่แข่ง ChatGPT ถูกกล่าวหาว่าไม่เคารพเงื่อนไขทั่วไปของการใช้งานเว็บไซต์ที่ห้ามการรวบรวมเนื้อหา เพื่อวัตถุประสงค์ในการฝึกอบรม AI เชิงสร้างสรรค์ อีกสองไซต์สังเกตเห็น "การคัดลอก" ที่สำคัญของหุ่นยนต์สำรวจของ Claude

มานุษยวิทยาบริษัทที่พัฒนา Claude ซึ่งเป็นหนึ่งในคู่แข่งของ ChatGPT มีความยินดีที่จะเจาะลึกเว็บไซต์เพื่อฝึก AI สร้างสรรค์โดยไม่เคารพเงื่อนไขทั่วไปของการใช้งานแพลตฟอร์มหรือไม่ นี่คือสิ่งที่ CEO ของ iFixit กล่าวหาเขา ซึ่งเป็นบริษัทที่นำเสนอเป็น “ฐานข้อมูลการซ่อมที่ใหญ่ที่สุด"ออนไลน์ Kyle Wiens กล่าวในบัญชีของเขาเอ็กซ์เมื่อวันที่ 24 กรกฎาคม โปรแกรมรวบรวมข้อมูลของสตาร์ทอัพ ซึ่งเป็นหุ่นยนต์ Web explorer ของ Claude ได้โจมตีเซิร์ฟเวอร์ของไซต์ของตนแล้ว "ล้านครั้งใน 24 ชั่วโมง»: คอลเลกชันที่ทำโดยละเมิดเงื่อนไขการใช้งานทั่วไปโดยสิ้นเชิง

ประการหลังกำหนดไว้แท้จริงว่า “ห้ามทำซ้ำ คัดลอก หรือแจกจ่ายเนื้อหา วัสดุ หรือองค์ประกอบการออกแบบใด ๆ บน (เว็บไซต์บริษัท) เพื่อวัตถุประสงค์อื่นใด รวมถึงการฝึกอบรมการเรียนรู้ของเครื่องหรือโมเดล AI โดยไม่ได้รับอนุญาตเป็นลายลักษณ์อักษรล่วงหน้าจาก iFixit- เงื่อนไขทั่วไปเหล่านี้ห้าม "การคัดลอก" ซึ่งเป็นการดึงเนื้อหาที่อนุญาตให้รวบรวมข้อมูลจากเว็บไซต์ เพื่อประกอบเป็นฐานที่จะใช้ในการฝึกโมเดลภาษา

อ่านเพิ่มเติม:ลิขสิทธิ์: เราอยู่จุดไหนในการต่อสู้ระหว่างผู้สร้าง ศิลปิน และนักพัฒนา AI

“คุณนำเนื้อหาของเราไปโดยไม่ต้องจ่ายเงิน คุณระดมทรัพยากรการพัฒนาของเรา”

-หากคำขอใดคำขอหนึ่งเหล่านี้เข้าถึงข้อกำหนดในการให้บริการของเรา ก็คงจะแจ้งให้คุณทราบว่าการใช้เนื้อหาของเราเป็นสิ่งต้องห้ามโดยชัดแจ้ง -“ ชี้แจง CEO ของ iFixit, Kyle Wiens บน X”คุณไม่เพียงแต่รับเนื้อหาของเราโดยไม่ต้องจ่ายเงิน แต่คุณยังใช้ประโยชน์จากทรัพยากรการพัฒนาของเราอีกด้วย หากคุณต้องการสนทนาเกี่ยวกับการอนุญาตเนื้อหาของเราเพื่อใช้ในเชิงพาณิชย์ เราอยู่ที่นี่“ เขากล่าวเสริม

iFixit มีเพจหลายพันหน้าตั้งแต่คู่มือการซ่อมไปจนถึงฟอรัม รวมถึงคำถามและคำตอบ: เนื้อหาที่ Claude ดึงความสนใจมาอย่างหนัก "ลอัตราการขูดนั้นสูงมากจนทำให้สัญญาณเตือนทั้งหมดของเราหายไปและระดมทีมพัฒนาของเรา» ระบุ Kyle Wiens เป็นหนึ่งในเพื่อนร่วมงานของเราที่หมิ่น- ในกโพสต์ในบล็อกเผยแพร่เมื่อไม่กี่วันที่ผ่านมา, Anthropic อธิบายว่า “ตามมาตรฐานอุตสาหกรรม(บริษัทที่ตั้งอยู่ในซานฟรานซิสโกและก่อตั้งโดยอดีตผู้บริหาร OpenAI, หมายเหตุบรรณาธิการ)ใช้แหล่งข้อมูลที่หลากหลายสำหรับการพัฒนาโมเดล เช่น ข้อมูลสาธารณะที่มีอยู่บนอินเทอร์เน็ตและรวบรวมผ่านโปรแกรมรวบรวมข้อมูลเว็บ- และ «เพื่อหลีกเลี่ยงไม่ให้โรบ็อตของ Claude สำรวจ คุณต้องแก้ไขไฟล์ robots.txt» และเพิ่มนามสกุลเฉพาะ เพิ่มบริษัท ไฟล์ประเภทนี้มักจะบอกโปรแกรมรวบรวมข้อมูลเว็บว่าหน้าเว็บใดที่พวกเขาสามารถเข้าถึงได้หรือไม่สามารถเข้าถึงได้

ส่วนขยายที่ iFixit เพิ่มได้อย่างรวดเร็ว บริษัทที่เชี่ยวชาญด้านการซ่อมออนไลน์ยืนยันว่าเมื่อติดตั้งส่วนขยายนี้แล้ว โปรแกรมรวบรวมข้อมูล Anthropic ก็หยุดทำงานแล้ว เจนนิเฟอร์ มาร์ติเนซ โฆษกสตาร์ทอัพให้สัมภาษณ์โดยหมิ่นแล้วชี้แจงว่าบริษัทเคารพ”ไฟล์ robots.txt โปรแกรมรวบรวมข้อมูลของเราเคารพสัญญาณนี้เมื่อ iFixit ใช้งาน- ซึ่งหมายความว่าข้อกำหนดและเงื่อนไขของเว็บไซต์ไม่เพียงพอที่จะหยุดบอทของ Anthropic เราต้องบล็อก "โปรแกรมรวบรวมข้อมูล" ของ AI เจนเนอเรชั่นนี้อย่างชัดเจนเพื่อหลีกเลี่ยงไม่ให้ข้อมูลไปอยู่ในฐานข้อมูลการฝึกอบรมของ Claude

อ่านเพิ่มเติม:Anthropic อ้างว่าเป็นโมเดลภาษาที่ดีที่สุดเมื่อเทียบกับ OpenAI และ Google

การแก้ไขข้อกำหนดและเงื่อนไขของคุณจะไม่ได้ผล

กรณีของ iFixit ยังห่างไกลจากความโดดเดี่ยว: ตามข้อมูลของ aการศึกษาที่เผยแพร่โดย Data Provenance Initiativeซึ่งนำเสนอตัวเองว่า “กลุ่มนักวิจัยอิสระและนักวิชาการที่อาสาสละเวลาในโครงการโปร่งใสของข้อมูล" เว็บไซต์หลายแห่งได้แก้ไขเงื่อนไขการใช้งานทั่วไป (CGU) เพื่อห้ามการคัดลอกเนื้อหาอย่างชัดเจน แต่สิ่งนี้จะไม่เกิดผลในทางปฏิบัติ เว้นแต่เว็บไซต์ต้องการฟ้องร้องบริษัทปัญญาประดิษฐ์รายนี้

ถามโดย404มีเดียShayne Longpre ผู้เขียนหลักของการศึกษานี้ ชี้แจงว่ามีเพียงข้อกำหนดและเงื่อนไขของแพลตฟอร์มขนาดใหญ่มากเท่านั้นที่ดูเหมือนจะได้รับการเคารพ กล่าวคือ แพลตฟอร์มที่บางทีอาจดำเนินการทางกฎหมายแล้ว แต่ส่วนที่เหลือกลับถูกบริษัท AI ละเลย เขากล่าวเสริม บริษัท Read the Docs และ Freelancer.com รายงานว่าถูกโปรแกรมรวบรวมข้อมูลของ Anthropic สกัดกั้นอย่างมีนัยสำคัญ ตามคำกล่าวของซีอีโอของพวกเขาเกี่ยวกับวัตถุประสงค์ในการฝึกอบรม AI ได้ก่อให้เกิดการดำเนินการทางกฎหมายมากมาย

อ่านเพิ่มเติม:OpenAI ถูกโจมตีโดย New York Times เพื่อขอสิทธิ์เข้าถึงเอกสารเตรียมการของนักข่าว

ในขณะที่บริษัท AI เชื่อว่าตนมีสิทธิใช้งานตัวเองบนเว็บภายใต้ “การใช้งานโดยชอบธรรม» ในสหรัฐอเมริกา – ข้อยกเว้นด้านลิขสิทธิ์ – หรือสิทธิการขุดข้อมูลในยุโรป ผู้จัดพิมพ์เชื่อว่านี่เป็นการละเมิดลิขสิทธิ์ของตน – และ“การปล้น” เนื้อหาของพวกเขา- การดำเนินการทางกฎหมายกำลังดำเนินการเพื่อแก้ไขปัญหา

🔴 เพื่อไม่ให้พลาดข่าวสารจาก 01net ติดตามเราได้ที่Google ข่าวสารetวอทส์แอพพ์-

“คุณนำเนื้อหาของเราไปโดยไม่ต้องจ่ายเงิน คุณระดมทรัพยากรการพัฒนาของเรา”

การแก้ไขข้อกำหนดและเงื่อนไขของคุณจะไม่ได้ผล

相關貼文