คำตัดสินของศาลกลางที่เข้าข้าง Anthropic ได้ประกาศว่าการฝึกโมเดล AI ด้วยหนังสือที่ตีพิมพ์แล้วโดยไม่ได้รับอนุญาตจากผู้เขียนถือเป็น fair use ภายใต้กฎหมายลิขสิทธิ์ อย่างไรก็ตาม การตัดสินนี้ได้จุดประกายการถกเถียงอย่างรุนแรงเกี่ยวกับอนาคตของโมเดล AI แบบ open-weight และทำให้เกิดคำถามเกี่ยวกับสิ่งที่แยกความแตกต่างระหว่างการฝึก AI ที่ถูกกฎหมายกับการละเมิดลิขสิทธิ์
คำตัดสินของผู้พิพากษา William Orrick กำหนดว่าบริษัท AI สามารถฝึกโมเดลของตนด้วยหนังสือที่มีลิขสิทธิ์ได้อย่างถูกกฎหมาย หากพวกเขาใช้มาตรการป้องกันที่เหมาะสม การตัดสินนี้ขึ้นอยู่กับความแตกต่างที่สำคัญ: แม้ว่าโมเดล AI อาจจดจำส่วนใหญ่ของงานที่มีลิขสิทธิ์ แต่บริษัทอย่าง Anthropic สามารถหลีกเลี่ยงการละเมิดได้โดยใช้การกรองฝั่งเซิร์ฟเวอร์เพื่อป้องกันไม่ให้ผู้ใช้ดึงเนื้อหาที่จดจำได้ออกมา
ความแตกต่างทางกฎหมายที่สำคัญ:
- การฝึกโมเดล AI ด้วยหนังสือที่มีลิขสิทธิ์ = การใช้งานที่เป็นธรรม (ด้วยการกรองที่เหมาะสม)
- การใช้สำเนาละเมิดลิขสิทธิ์สำหรับการฝึก = การละเมิดลิขสิทธิ์
- การกรองฝั่งเซิร์ฟเวอร์ = การคุ้มครองทางกฎหมายสำหรับโมเดลแบบปิด
- โมเดลแบบเปิดน้ำหนักโดยไม่มีการกรอง = การละเมิดลิขสิทธิ์ที่อาจเกิดขึ้น
ปัญหาของโมเดล Open-Weight
คำตัดสินนี้สร้างความท้าทายที่สำคัญสำหรับโมเดล AI แบบ open-weight อย่างซีรีส์ Llama ของ Meta ไม่เหมือนกับระบบปิดที่สามารถควบคุมผลลัพธ์ผ่านตัวกรองฝั่งเซิร์ฟเวอร์ โมเดล open-weight สามารถดาวน์โหลดและรันในเครื่องโดยไม่มีข้อจำกัดเนื้อหาใดๆ นี่หมายความว่าผู้ใช้อาจสามารถดึงเนื้อหาที่มีลิขสิทธิ์ที่จดจำได้โดยตรงจาก model weights
การอภิปรายในชุมชนเทคโนโลยีเผยให้เห็นความกังวลที่เพิ่มขึ้นว่ากรอบกฎหมายนี้อาจจะกำจัดโมเดล AI โอเพนซอร์สที่มีความสามารถกว้างขวางได้อย่างมีประสิทธิภาพ ต้นทุนในการได้มาซึ่งวัสดุฝึกอบรมอย่างถูกกฎหมายสำหรับระบบ AI ที่ครอบคลุมอาจต้องการการสนับสนุนมูลค่าหลายล้านดอลลาร์สหรัฐ ซึ่งสร้างอุปสรรคที่สำคัญสำหรับนักพัฒนาและนักวิจัยรายเล็ก
ผลกระทบต่อประเภทของโมเดล AI:
- โมเดลแบบปิด ( ChatGPT , Claude ): ได้รับการปกป้องด้วยระบบกรองฝั่งเซิร์ฟเวอร์ สามารถดำเนินการตามแนวทางปฏิบัติปัจจุบันต่อไปได้
- โมเดลแบบ Open-Weight ( Llama และอื่นๆ): เผชิญกับความเป็นไปได้ที่จะสูญพันธุ์เนื่องจากไม่สามารถควบคุมผลลัพธ์ที่ออกมาได้
- ต้นทุนการฝึกอบรม: การได้มาซึ่งชุดข้อมูลที่ถูกกฎหมายอาจมีค่าใช้จ่ายหลายล้าน USD สำหรับโมเดลที่ครอบคลุม
ปัญหาการละเมิดลิขสิทธิ์ยังไม่ได้รับการแก้ไข
แม้ว่าศาลจะตัดสินในเรื่องการฝึกอย่างเอื้ออำนวย แต่ Anthropic ยังคงเผชิญการพิจารณาคดีแยกต่างหากสำหรับการใช้สำเนาหนังสือที่ละเมิดลิขสิทธิ์ระหว่างกระบวนการฝึกเริ่มต้น ผู้พิพากษา Alsup ได้ชี้แจงอย่างชัดเจนว่าการซื้อสำเนาที่ถูกกฎหมายภายหลังไม่ได้ทำให้บริษัทพ้นจากความรับผิดสำหรับการละเมิดลิขสิทธิ์ครั้งแรก แม้ว่าอาจลดค่าเสียหายตามกฎหมายได้
ความแตกต่างระหว่างวิธีการฝึกที่ถูกกฎหมายและการได้มาซึ่งข้อมูลอย่างผิดกฎหมายนี้อาจเปลี่ยนแปลงวิธีที่บริษัท AI เข้าหาการสร้างชุดข้อมูล คำตัดสินนี้แสดงให้เห็นว่าบริษัทต้องได้รับสำเนาที่ถูกกฎหมายของงานที่มีลิขสิทธิ์ก่อนการฝึก คล้ายกับวิธีที่ Google Books ดำเนินการด้วยข้อตกลงการอนุญาตที่เหมาะสม
ผลกระทบต่ออุตสาหกรรม AI
การตัดสินนี้แสดงถึงชัยชนะที่สำคัญสำหรับบริษัท AI ใหญ่ ในขณะที่อาจสร้างอุปสรรคใหม่สำหรับการพัฒนาโอเพนซอร์ส ผู้เชี่ยวชาญในชุมชนระบุว่าคำตัดสินนี้ไม่ได้สร้างแบบอย่างที่มีผลผูกพันเนื่องจากมาจากศาลแขวง แต่ให้แผนที่สำหรับผู้พิพากษาคนอื่นๆ ที่เผชิญกับคดีที่คล้ายกัน
โมเดลแบบเปิดที่มีความสามารถกว้างขวางกำลังมุ่งสู่การถูกทำลายล้าง ต้นทุนในการได้มาซึ่งวัสดุฝึกอบรมทั้งหมดอย่างถูกกฎหมายจะต้องการการสนับสนุนที่แข็งแกร่ง
คำตัดสินนี้ยังทำให้เกิดคำถามเกี่ยวกับความสามารถในการแข่งขันระหว่างประเทศ เนื่องจากประเทศที่มีแนวทางการบังคับใช้ลิขสิทธิ์ที่แตกต่างกันอาจได้รับประโยชน์ในการพัฒนา AI กรอบกฎหมายนี้อาจผลักดันการพัฒนา AI ไปสู่เขตอำนาจศาลที่มีกฎหมายทรัพย์สินทางปัญญาที่อนุญาตมากกว่า
คดีนี้เน้นย้ำถึงความตึงเครียดที่ยังคงดำเนินต่อไประหว่างการปกป้องสิทธิของผู้สร้างสรรค์และการส่งเสริมนวัตกรรมทางเทคโนโลยี เมื่อความสามารถของ AI ยังคงก้าวหน้าต่อไป ศาลและนักการเมืองจะต้องสร้างสมดุลระหว่างผลประโยชน์ที่แข่งขันกันเหล่านี้ในขณะที่ให้แน่ใจว่าผู้สร้างเนื้อหาที่มีผลงานช่วยให้ระบบที่ทรงพลังเหล่านี้เป็นไปได้จะได้รับค่าตอบแทนที่ยุติธรรม