Free Software Foundation เผชิญกับภาวะกลืนไม่เข้าคายไม่ออกของโค้ดที่สร้างโดย LLM

ทีมชุมชน BigGo
Free Software Foundation เผชิญกับภาวะกลืนไม่เข้าคายไม่ออกของโค้ดที่สร้างโดย LLM

Free Software Foundation พบว่าตนเองอยู่ที่ทางแยก ขณะที่เผชิญกับความท้าทายที่ซับซ้อนจากโมเดลภาษาขนาดใหญ่ในการพัฒนาซอฟต์แวร์ ในขณะที่องค์กรเพิ่งจัดการอภิปรายเกี่ยวกับจุดตัดระหว่างการอนุญาตใช้ซอฟต์แวร์เสรีและโค้ดที่สร้างโดย AI แต่วงการนักพัฒนาได้ถกเถียงกันอย่างแข็งขันเกี่ยวกับผลกระทบในทางปฏิบัติ ความกังวลด้านกฎหมาย และข้อพิจารณาด้านจริยธรรมที่ล้อมรอบเทคโนโลยีเกิดใหม่นี้

ปัญหาการนำไปใช้ในทางปฏิบัติ

นักพัฒนาที่เคยทำงานกับ LLM สำหรับการเขียนโค้ดได้ชี้ให้เห็นข้อบกพร่องในทางปฏิบัติที่สำคัญในแนวทางที่ FSF เสนอ คำแนะนำที่ว่าโค้ดที่สร้างโดย LLM ควรถูกทำเครื่องหมายอย่างชัดเจนและมาพร้อมกับพรอมต์ดั้งเดิมนั้นเผชิญกับความท้าทายในการนำไปใช้อย่างรุนแรง ตามที่นักพัฒนาคนหนึ่งระบุจากประสบการณ์ การโต้ตอบกับผู้ช่วยการเขียนโค้ด AI มักเกี่ยวข้องกับการทำซ้ำหลายครั้ง การแก้ไข และการปรับปรุงใหม่ที่ทำให้เส้นแบ่งระหว่างการเป็นผู้สร้างของมนุษย์และเครื่องจักรพร่ามัว

บางครั้งเมื่อพยายามให้ LLM สร้างบางอย่างสำหรับผม ผมปล่อยให้มันสร้างโค้ดอะไรก็ตามที่มันคิดออกมา แล้วผมก็เริ่มแก้ไขคำตอบของมันเพื่อแก้ไขข้อบกพร่อง เพื่อให้คำแนะนำต่อไปนี้ตั้งอยู่บนสมมติฐานว่ามันสร้างโค้ดที่ถูกต้องตั้งแต่แรกแล้ว ในสถานการณ์เช่นนั้น ไม่มีการแยกที่ชัดเจนระหว่างโค้ดที่สร้างโดย LLM และโค้ดที่เขียนด้วยมือ

กระบวนการนี้ยิ่งซับซ้อนมากขึ้นเมื่อนักพัฒนาใช้โมเดลท้องถิ่นที่อนุญาตให้เขียนประวัติการสนทนาทั้งหมดใหม่ หรือใช้เครื่องมืออัตโนมัติที่สร้างพรอมต์ของพวกเขาเองเบื้องหลัง ทำให้การติดตามต้นตอที่แท้จริงของโค้ดส่วนใดส่วนหนึ่งเกือบเป็นไปไม่ได้ และทำให้เกิดคำถามว่าข้อกำหนดการจัดทำเอกสารที่ FSF เสนอนั้นปฏิบัติได้จริงในสถานการณ์การพัฒนาของโลกแห่งความเป็นจริงหรือไม่

ความไม่แน่นอนด้านลิขสิทธิ์และกฎหมาย

ภูมิทัศน์ทางกฎหมายที่ล้อมรอบโค้ดที่สร้างโดย LLM ยังคงคลุมเครือ พร้อมกับการถกเถียงอย่างเผ็ดร้อนเกี่ยวกับการละเมิดลิขสิทธิ์และการใช้อย่างเป็นธรรม สมาชิกในชุมชนบางส่วนเรียก LLM ว่าการละเมิดลิขสิทธิ์เป็นบริการ โดยอ้างว่าผู้ให้บริการโมเดลกำลังใช้โค้ดที่ขโมยมาสำหรับการฝึกฝนโดยไม่มีการให้คุณค่าหรือการชดเชยที่เหมาะสม ความกังวลไม่ใช่แค่เกี่ยวกับการคัดลอกคำต่อคำเท่านั้น แต่ยังขยายไปถึงโค้ดที่ได้รับแรงบันดาลใจอย่างมากจากงานที่มีลิขสิทธิ์โดยไม่มีการให้คุณค่าที่ชัดเจน

การป้องกันการใช้อย่างเป็นธรรมสำหรับข้อมูลการฝึก AI ถูกตั้งคำถาม โดยเฉพาะอย่างยิ่งเนื่องจากประเทศส่วนใหญ่ขาดกรอบกฎหมายเฉพาะที่ดำรงอยู่ในสหรัฐอเมริกา แม้ในขณะที่โมเดลได้รับการฝึกฝนจากวัสดุที่ได้รับอนุญาตอย่างเสรีโดยเฉพาะ ก็ยังมีความกังวลเกี่ยวกับว่าพวกมันรักษาข้อความลิขสิทธิ์ที่จำเป็นไว้อย่างเหมาะสมหรือไม่ ซึ่งยังคงสามารถประกอบเป็นการละเมิดสัญญาอนุญาตได้

นอกจากนี้ยังมีประเด็นปัญหาที่น่าวิตกว่าผู้ให้บริการ LLM บางรายรวมถึงข้อกำหนดในการบริการที่อ้างสิทธิ์ลิขสิทธิ์เหนือผลลัพธ์ของโมเดล การรวมโค้ดดังกล่าวเข้าในโครงการซอฟต์แวร์เสรีอาจเปิดเผยโครงการเหล่านั้นต่อการอ้างสิทธิ์ลิขสิทธิ์ที่ไม่คาดคิดจากบริษัทเดียวกันที่ให้เครื่องมือ AI

ข้อกังวลหลักของชุมชนเกี่ยวกับโค้ดที่สร้างโดย LLM:

  • ความยากลำบากในการติดตามเชิงปฏิบัติในเวิร์กโฟลว์การพัฒนาแบบผสมผสานระหว่างมนุษย์และ AI
  • ความเสี่ยงจากการละเมิดลิขสิทธิ์อันเนื่องมาจากการรั่วไหลของข้อมูลการฝึกอบรม
  • ปัญหาการปฏิบัติตามข้อกำหนดของใบอนุญาตที่มีข้อมูลการฝึกอบรมที่ได้รับอนุญาตแบบเสรี
  • ผลกระทบด้านการเข้าถึงสำหรับนักพัฒนาที่มีความพิการ
  • การอ้างสิทธิ์ตามข้อกำหนดการให้บริการเหนือผลลัพธ์ที่สร้างโดย AI
  • ความท้าทายในการตรวจสอบแหล่งที่มาของโค้ด

ภาวะกลืนไม่เข้าคายไม่ออกด้านการเข้าถึง

ประเด็นสำคัญที่ถูกหยิบยกขึ้นในการอภิปรายของชุมชนเน้นย้ำถึงผลกระทบเชิงลบที่อาจเกิดขึ้นจากการห้ามใช้ LLM อย่างสิ้นเชิงต่อนักพัฒนาที่มีความพิการ LLM สามารถทำหน้าที่เป็นเทคโนโลยีช่วยเหลือที่สำคัญสำหรับโปรแกรมเมอร์ที่มีความท้าทายทางจิตหรือการรู้คิดต่างๆ ช่วยพวกเขาเอาชนะอุปสรรคที่อาจป้องกันไม่ให้พวกเขามีส่วนร่วมในโครงการซอฟต์แวร์เสรี

สิ่งนี้สร้างการทรงตัวที่ยากลำบากสำหรับองค์กรเช่น FSF ในขณะที่พวกเขาจำเป็นต้องปกป้องเสรีภาพของซอฟต์แวร์และรับรองการปฏิบัติตามสัญญาอนุญาต พวกเขาก็ไม่ต้องการสร้างอุปสรรคที่กีดกันนักพัฒนาที่พึ่งพาเครื่องมือเหล่านี้ด้วยเหตุผลด้านการเข้าถึง ทางออกอาจอยู่ที่การมุ่งเน้นไปที่ความรับผิดชอบของนักพัฒนาแทนการห้ามใช้เครื่องมือ เพื่อให้แน่ใจว่าผู้มีส่วนร่วมรับผิดชอบต่อโค้ดที่พวกเขาส่งเข้ามาโดยไม่คำนึงว่ามันถูกสร้างขึ้นมาอย่างไร

ความแตกแยกทางปรัชญาและความไว้วางใจในสถาบัน

แนวทางของ FSF ต่อความท้าทายของ LLM ได้เผยให้เห็นความแตกแยกทางปรัชญาที่ลึกซึ้งภายในชุมชนซอฟต์แวร์เสรี ผู้สนับสนุนบางส่วนที่อยู่มานานแสดงความกังวลว่าองค์กรขาดความเร่งด่วนและวิสัยทัศน์ที่ชัดเจนที่จำเป็นในการเผชิญหน้ากับผลประโยชน์ AI ขององค์กรอย่างมีประสิทธิภาพ การขาดการเปลี่ยนแปลงสัญญาอนุญาตที่เป็นรูปธรรมหรือจุดยืนที่แข็งแกร่งได้ทิ้งให้สมาชิกชุมชนบางส่วนตั้งคำถามถึงทิศทางของ FSF ในยุคหลัง Stallman

การอภิปรายเกี่ยวกับ LLM สะท้อนให้เห็นถึงความท้าทายก่อนหน้าที่ขบวนการซอฟต์แวร์เสรีเคยเผชิญกับคลาวด์คอมพิวติ้งและซอฟต์แวร์เป็นบริการ ซึ่งองค์กรถูกมองว่าตอบสนองต่อการเปลี่ยนแปลงทางเทคโนโลยีอย่างช้าๆ รูปแบบนี้ได้นำไปสู่ความกังวลเกี่ยวกับว่า FSF สามารถปรับหลักการของตนให้เข้ากับเทคโนโลยีที่พัฒนาอย่างรวดเร็วในขณะที่รักษาคุณค่าหลักของตนได้อย่างมีประสิทธิภาพหรือไม่

คำถามเกี่ยวกับความรับผิดชอบของมนุษย์

ท่ามกลางความซับซ้อนทางเทคนิคและกฎหมายทั้งหมด ธีมที่สอดคล้องกันหนึ่งประการปรากฏขึ้น: ความจำเป็นในการรับผิดชอบของมนุษย์ ตามที่ผู้แสดงความคิดเห็นหนึ่งคนระบุ ต้องมีมนุษย์อยู่ในวงจรเสมอ; ในท้ายที่สุด พวกเขาคือผู้รับผิดชอบต่อโค้ดที่พวกเขาส่งเข้ามา หลักการนี้สอดคล้องกับแนวปฏิบัติที่มีอยู่เช่นใบรับรองต้นทางของนักพัฒนาที่ใช้ในหลายโครงการ ซึ่งต้องการให้ผู้มีส่วนร่วมยืนยันว่าพวกเขามีสิทธิ์ที่จะส่งโค้ดในคำถาม

ความท้าทายอยู่ที่การให้ความรู้แก่ผู้พัฒนาถึงความรับผิดชอบของพวกเขาเมื่อใช้เครื่องมือ AI และทำให้แน่ใจว่าพวกเขาเข้าใจความหมายทางกฎหมายและจริยธรรมของการรวมโค้ดที่สร้างโดย LLM เข้าในโครงการซอฟต์แวร์เสรี หากไม่มีการศึกษาและแนวทางที่ชัดเจน นักพัฒนาที่มีความตั้งใจดีอาจนำโค้ดที่มีปัญหาเข้าไปในโครงการสำคัญโดยไม่ตั้งใจ

ชุมชนซอฟต์แวร์เสรีพบว่าตนเองกำลังเดินทางในพื้นที่ที่ไม่เคยมีแผนที่ด้วยโค้ดที่สร้างโดย AI ในขณะที่ประโยชน์ในทางปฏิบัติของ LLM สำหรับการเขียนโปรแกรมนั้นปฏิเสธไม่ได้ แต่คำถามทางกฎหมาย จริยธรรม และปรัชญาที่พวกเขายกขึ้นมายังคงไม่ได้รับการแก้ไขเป็นส่วนใหญ่ ในขณะที่เทคโนโลยียังคงพัฒนาต่อไป การสนทนาระหว่างองค์กรเช่น FSF และชุมชนนักพัฒนาในวงกว้างจะมีความสำคัญในการกำหนดว่าหลักการซอฟต์แวร์เสรีปรับตัวให้เข้ากับภูมิทัศน์ทางเทคโนโลยีใหม่นี้อย่างไร

อ้างอิง: The FSF considers large language models