คำตัดสินของศาลล่าสุดที่เอื้อประโยชน์ต่อ Anthropic ได้จุดประกายการถกเถียงเกี่ยวกับการที่บริษัท AI สามารถฝึกโมเดลของตนด้วยเนื้อหาที่มีลิขสิทธิ์ได้อย่างถูกกฎหมายหรือไม่ แม้ว่าบริษัทจะชนะคดีบางส่วนสำหรับการสแกนหนังสือ แต่คดีนี้เผยให้เห็นคำถามที่ลึกซึ้งยิ่งขึ้นเกี่ยวกับการที่กฎหมายลิขสิทธิ์นำไปใช้กับปัญญาประดิษฐ์ในยุคดิจิทัลอย่างไร
การต่อสู้ทางกฎหมายเกิดขึ้นจากช่วงแรกของ Anthropic เมื่อบริษัทที่ก่อตั้งโดยนักวิจัยเดิมจาก OpenAI ได้ดาวน์โหลดหนังสือละเมิดลิขสิทธิ์หลายล้านเล่มเพื่อฝึกโมเดล AI ของตน ระหว่างปี 2021 ถึง 2022 พวกเขาได้รับสำเนาที่ไม่ได้รับอนุญาตมากกว่า 7 ล้านเล่มจากเว็บไซต์ละเมิดลิขสิทธิ์ที่มีชื่อเสียงรวมถึง Books3, Library Genesis และ Pirate Library Mirror ต่อมาบริษัทได้เปลี่ยนไปใช้แนวทางที่ถูกต้องตามกฎหมายมากขึ้น โดยใช้เงินหลายล้านดอลลาร์สหรัฐเพื่อซื้อและสแกนหนังสือจริง
ไทม์ไลน์การซื้อหนังสือของ Anthropic :
- มกราคม-กุมภาพันธ์ 2021: ดาวน์โหลด Books3 (หนังสือละเมิดลิขสิทธิ์ 196,640 เล่ม)
- มิถุนายน 2021: ดาวน์โหลดหนังสือกว่า 5 ล้านเล่มจาก Library Genesis
- กรกฎาคม 2022: ดาวน์โหลดหนังสือกว่า 2 ล้านเล่มจาก Pirate Library Mirror
- กุมภาพันธ์ 2024: จ้างหัวหน้าแผนกพันธมิตรสแกนหนังสือเดิมของ Google
- 2024: ซื้อและสแกนหนังสือจริงหลายล้านเล่มด้วยเงินหลายล้านดอลลาร์สหรัฐ
การเปรียบเทียบระหว่างมนุษย์กับ AI ถูกโจมตี
คำตัดสินของผู้พิพากษา William Alsup ได้เปรียบเทียบการเรียนรู้ของมนุษย์กับการฝึกอบรม AI โดยให้เหตุผลว่าเช่นเดียวกับที่ผู้คนอ่านหนังสือและนำมาใช้ในการเขียน โมเดล AI ก็ควรมีสิทธิ์เช่นเดียวกัน อย่างไรก็ตาม การเปรียบเทียบนี้ได้จุดประกายการถกเถียงอย่างรุนแรงในชุมชนเทคโนโลยี
นักวิจารณ์โต้แย้งว่าการให้ลักษณะเหมือนมนุษย์นี้ไม่ได้เข้าใจประเด็นสำคัญเกี่ยวกับขนาดและความเร็ว ปัญหาพื้นฐานไม่ใช่ว่า AI สามารถเรียนรู้จากหนังสือได้หรือไม่ แต่เป็นเรื่องของกฎหมาย fair use ที่มีอยู่สามารถรับมือกับขนาดมหาศาลที่ระบบเหล่านี้ทำงานได้หรือไม่ ไม่เหมือนมนุษย์ที่อาจอ่านหนังสือหลายร้อยเล่มในชีวิต โมเดล AI สามารถประมวลผลงานหลายล้านชิ้นพร้อมกันและตอบสนองต่อคำถามนับไม่ถ้วนได้ทันที
แต่การทำให้ใครก็ตามต้องจ่ายเงินเฉพาะสำหรับการใช้หนังสือในแต่ละครั้งที่พวกเขาอ่าน แต่ละครั้งที่พวกเขาระลึกขึ้นได้จากความทรงจำ แต่ละครั้งที่พวกเขานำมาใช้ในการเขียนสิ่งใหม่ในรูปแบบใหม่นั้นเป็นสิ่งที่คิดไม่ถึง
ขนาดเปลี่ยนแปลงทุกอย่าง
การถกเถียงในชุมชนเผยให้เห็นความกังวลสำคัญ: ความเร็วและขนาดเปลี่ยนแปลงภูมิทัศน์ทางกฎหมายโดยพื้นฐาน หลายคนชี้ให้เห็นว่า fair use ถูกออกแบบมาสำหรับกิจกรรมในระดับมนุษย์ ไม่ใช่การประมวลผลข้อมูลในระดับอุตสาหกรรม เมื่อระบบ AI สามารถระลึกและสังเคราะห์ข้อมูลจากงานที่มีลิขสิทธิ์หลายล้านชิ้นได้ทันที มันอาจทำลายแรงจูงใจทางเศรษฐกิจที่ลิขสิทธิ์ตั้งใจจะปกป้อง
บางคนเปรียบเทียบสิ่งนี้กับพื้นที่อื่นที่ขนาดเปลี่ยนความถูกต้องตามกฎหมาย เว็บไซต์ที่ได้รับการเข้าชมตามธรรมชาติจากโซเชียลมีเดียไม่ได้ละเมิดกฎหมายใดๆ แต่ปริมาณคำขอแบบอัตโนมัติในปริมาณเดียวกันจะถือเป็นการโจมตี DDoS ความแตกต่างไม่ได้อยู่ที่เจตนาเท่านั้น แต่อยู่ที่ความสามารถทางเทคโนโลยีที่ทำให้ขนาดเช่นนั้นเป็นไปได้
สรุปคำตัดสินของศาล:
- ชัยชนะด้าน Fair Use: การดำเนินการสแกนหนังสือถือเป็นการเปลี่ยนแปลงรูปแบบและได้รับการคุ้มครอง
- ความรับผิดจากการละเมิดลิขสิทธิ์: การดาวน์โหลดเนื้อหาที่ละเมิดลิขสิทธิ์ไม่ได้รับการคุ้มครองภายใต้ fair use
- ขั้นตอนต่อไป: รอการพิจารณาคคดีโดยคณะลูกขุนสำหรับการดาวน์โหลดหนังสือที่ละเมิดลิขสิทธิ์
- แนวคำตัดสินทางกฎหมาย: คำตัดสินครั้งแรกที่สำคัญเกี่ยวกับ fair use ในข้อมูลการฝึก AI
ผลลัพธ์ทางกฎหมายที่หลากหลาย
คำตัดสินของศาลมีความซับซ้อน โดยพบว่าการสแกนหนังสือในภายหลังของ Anthropic มีคุณสมบัติเป็น fair use เนื่องจากเป็นการเปลี่ยนแปลงรูปแบบและเก็บไว้ภายใน อย่างไรก็ตาม การดาวน์โหลดเนื้อหาละเมิดลิขสิทธิ์ในช่วงแรกไม่ได้รับการปกป้องเช่นเดียวกันและน่าจะต้องเผชิญกับการพิจารณาคดีโดยคณะลูกขุน
คำตัดสินที่แบ่งแยกนี้เน้นย้ำถึงความซับซ้อนของการนำแนวคิดลิขสิทธิ์แบบดั้งเดิมไปใช้กับการพัฒนา AI แม้ว่าบริษัทต่างๆ อาจอ้าง fair use สำหรับการฝึกอบรม AI ที่เปลี่ยนแปลงรูปแบบได้ แต่พวกเขาไม่สามารถเพิกเฉยต่อลิขสิทธิ์โดยใช้เนื้อหาละเมิดลิขสิทธิ์เป็นข้อมูลต้นทาง
คำตัดสินนี้สร้างแบบอย่างที่สำคัญ แต่ยังไม่ใช่คำพูดสุดท้าย ด้วยคดีที่คล้ายกันที่รอการพิจารณาต่อบริษัท AI ใหญ่อื่นๆ และเขตอำนาจศาลต่างๆ ที่อาจมีข้อสรุปแตกต่างกัน ภูมิทัศน์ทางกฎหมายสำหรับข้อมูลฝึกอบรม AI ยังคงไม่แน่นอน อุตสาหกรรมเทคโนโลยีจะติดตามอย่างใกล้ชิดขณะที่คดีเหล่านี้ดำเนินไป โดยรู้ว่าผลลัพธ์อาจเปลี่ยนแปลงวิธีการพัฒนาและนำระบบ AI ไปใช้
อ้างอิง: Anthropic wins a major fair use victory for Al - but it's still in trouble for stealing books