เครื่องมือ Create-LLM ก่อให้เกิดการถกเถียงเกี่ยวกับที่มาของโค้ดที่สร้างโดย AI

ทีมชุมชน BigGo
เครื่องมือ Create-LLM ก่อให้เกิดการถกเถียงเกี่ยวกับที่มาของโค้ดที่สร้างโดย AI

ในโลกแห่งการพัฒนาเทคโนโลยีปัญญาประดิษฐ์ที่ก้าวหน้าอย่างรวดเร็ว เครื่องมือใหม่ชื่อว่า create-llm ได้ปรากฏตัวขึ้น โดยสัญญาว่าจะทำให้กระบวนการฝึกฝนโมเดลภาษาที่กำหนดเองซึ่งซับซ้อนนั้นง่ายดายยิ่งขึ้น โครงการนี้ซึ่งมีเป้าหมายเพื่อให้การฝึกฝน LLM เข้าถึงได้ง่ายเหมือนการรัน npx create-next-app ได้สร้างความตื่นตัวในชุมชนอย่างมาก—แต่ไม่ใช่ด้วยเหตุผลที่ผู้สร้างอาจคาดหวังเสมอไป การอภิปรายได้เปลี่ยนโฟกัสอย่างรวดเร็วจากความสามารถทางเทคนิคไปสู่คำถามเกี่ยวกับโค้ดที่สร้างโดย AI และความโปร่งใสในการพัฒนาโปรแกรมสมัยใหม่

คำสัญญา เทียบกับ ที่มา

Create-llm ตำแหน่งตัวเองเป็นโซลูชันครบวงจรสำหรับนักพัฒนาที่ต้องการฝึกฝนโมเดลภาษาของตัวเองโดยไม่ต้องผ่านความซับซ้อนของโครงสร้างพื้นฐานตามปกติ เครื่องมือนี้มีตัวเลือกเทมเพลตสี่แบบ ตั้งแต่โมเดล NANO ที่มีพารามิเตอร์ประมาณ 15 ล้านตัว ซึ่งสามารถฝึกฝนได้ในไม่กี่นาทีบนแล็ปท็อป ไปจนถึงโมเดล BASE ที่มีพารามิเตอร์ 1.5 พันล้านตัว ซึ่งต้องใช้ GPU หลายตัวและใช้เวลาฝึกฝนหลายวัน จากเอกสารประกอบโครงการระบุว่ามันจัดการทุกอย่างตั้งแต่การเลือกโครงสร้างโมเดล การประมวลผลข้อมูลเบื้องต้น ไปจนถึงการฝึก Tokenizer และเครื่องมือสำหรับการนำไปใช้งาน ด้วยคำสั่งเดียว

อย่างไรก็ตาม การตอบรับจากชุมชนเผยให้เห็นคำถามที่ลึกซึ้งยิ่งขึ้นเกี่ยวกับวิธีการสร้างเครื่องมือนี้ มีผู้ใช้คนหนึ่งชี้ไปที่การตัดสินใจออกแบบโครงสร้างที่ผิดปกติ โดยตั้งข้อสังเกตว่า คุณเลือกที่จะเก็บสคริปต์ Python เป็นสตริงในไฟล์ TypeScript แทนที่จะเป็นไฟล์สคริปต์ Python อย่างนั้นหรือ? การสังเกตนี้ได้จุดประกายการสนทนาในวงกว้างเกี่ยวกับสิ่งที่เป็นงานพัฒนาที่แท้จริงในยุคของผู้ช่วย AI ประวัติการ commit ของโครงการ ซึ่งรวมถึงข้อความ commit ที่ย่อเหลือเพียงจุดเดียวและการเพิ่มเอกสารประกอบจำนวนมาก ได้เพิ่มความเคลือขแคลงใจเกี่ยวกับกระบวนการพัฒนามากขึ้นไปอีก

หากเป็นงานของพวกเขาจริง ประเด็นของคุณก็คงจะใช้ได้

ข้อกำหนดเทมเพลต Create-LLM

เทมเพลต พารามิเตอร์ ความต้องการฮาร์ดแวร์ เวลาในการเทรน ขนาดชุดข้อมูลที่แนะนำ
NANO ~15M CPU (150MB RAM) ~1 นาที 100+ ตัวอย่าง
TINY ~100M CPU หรือ GPU (8GB VRAM) 15 นาที 1,000+ ตัวอย่าง
SMALL ~500M GPU (16GB VRAM) 1 ชั่วโมง 10,000+ ตัวอย่าง
BASE ~1.5B 4xGPU (64GB VRAM) 1+ วัน 100,000+ ตัวอย่าง

การอภิปรายเกี่ยวกับความโปร่งใสในการใช้ผู้ช่วย AI

ผู้สร้าง create-llm ได้เปิดเผยเกี่ยวกับการใช้ AI ในกระบวนการพัฒนาค่อนข้างโปร่งใส ถึงแม้ขอบเขตจะยังเป็นที่ถกเถียงกันอยู่ ในการตอบคำถามโดยตรงเกี่ยวกับการมีส่วนร่วมของ AI พวกเขายอมรับว่า ส่วนใหญ่เป็นงานซ้ำๆ อย่างเช่น การสร้าง README และการ push code พร้อมกับข้อความ commit ที่มีความหมาย ถูกจัดการโดย AI ส่วนงานและตรรกะที่แท้จริงทำโดยผมเอง การยอมรับนี้เน้นย้ำถึงบรรทัดฐานที่กำลังพัฒนารอบๆ การพัฒนาที่ได้รับความช่วยเหลือจาก AI ซึ่งเส้นแบ่งระหว่างโค้ด样板และโค้ดที่มีสาระสำคัญเริ่มเลือนลางมากขึ้นเรื่อยๆ

ผู้วิจารณ์บางส่วนแย้งว่าลักษณะบางอย่างใน codebase บ่งชี้ถึงการมีส่วนร่วมของ AI ที่มากกว่าที่ได้รับการยอมรับ การใช้คำสั่ง if-else ในกรณีที่ควรใช้ match case การใส่เอโมจิในความคิดเห็นการ execute สคริปต์ และการเก็บโค้ด Python เป็นสตริงในไฟล์ TypeScript ต่างถูกอ้างถึงเป็นตัวบ่งชี้ที่เป็นไปได้ของการสร้างโดย AI ดังที่สมาชิกในชุมชนคนหนึ่งระบุ ลักษณะเหล่านี้สอดคล้องกับพฤติกรรมที่รู้จักของ LLM มากกว่าการปฏิบัติการเขียนโค้ดทั่วไปของมนุษย์ การอภิปรายนี้สะท้อนให้เห็นถึงความตึงเครียดในอุตสาหกรรมในวงกว้างเกี่ยวกับสิ่งที่นับเป็นงานพัฒนาที่ถูกต้อง เมื่อเครื่องมือ AI สามารถสร้างโค้ดที่ใช้งานได้อย่างรวดเร็ว

คุณสมบัติหลักของ Create-LLM

  • โครงสร้างพื้นฐานสำหรับการเทรนที่ครบถ้วนด้วย PyTorch
  • ตัวเลือก tokenizer หลากหลายรูปแบบ (BPE, WordPiece, Sentencepiece)
  • ระบบจัดการ checkpoint ในตัวและการผสานรวมกับ Tensorboard
  • ระบบ plugin สำหรับ Wandb, HuggingFace และ Synthcity
  • อินเทอร์เฟซแชทแบบโต้ตอบสำหรับทดสอบโมเดลที่เทรนแล้ว
  • สคริปต์สำหรับการ deploy ไปยัง AWS และ HuggingFace

ความแตกแยกในชุมชนและผลกระทบในอนาคต

ปฏิกิริยาต่อ create-llm เผยให้เห็นมุมมองของชุมชนที่แบ่งแยกในเรื่องโค้ดที่สร้างโดย AI นักพัฒนาบางส่วนไม่สนใจข้อกังวลเหล่านี้ โดยให้เหตุผลว่า ใครจะสนว่ามันทำ (บางส่วน) โดย AI บ้างล่ะ ใครก็ตามที่รู้สึกขุ่นเคืองกับการที่คนใช้ AI ในการเขียนโค้ด ก็แค่กำลังปรับตัวกับสถานการณ์ปัจจุบันได้ยาก ขณะที่บางคนยืนยันว่าความโปร่งใสเกี่ยวกับที่มามีความสำคัญอย่างยิ่ง โดยเฉพาะสำหรับเครื่องมือทางการศึกษาที่มีจุดประสงค์เพื่อช่วยให้นักพัฒนาเข้าใจระบบที่ซับซ้อนอย่างเช่นโมเดลภาษา

ข้อโต้แย้งนี้触及到คำถามพื้นฐานเกี่ยวกับจริยธรรมในการพัฒนาโอเพนซอร์ส เมื่อโครงการนำเสนอตัวเองเป็นแหล่งทรัพยากรทางการศึกษาเพื่อทำความเข้าใจการฝึกฝน LLM ความถูกต้องแท้ของการนำไปใช้งานจึงมีความเกี่ยวข้องเป็นพิเศษ ดังที่ผู้ใช้คนหนึ่งได้วางกรอบไว้ว่า มันไม่เกี่ยวกับความจริงที่ว่ามันถูกสร้างโดย AI ทั้งหมด ผมไม่สนใจเรื่องนั้นเป็นการส่วนตัว แต่ผมสนใจถ้ามีคนโกหกเกี่ยวกับที่มา ความรู้สึกนี้เน้นย้ำว่าความไว้วางใจยังคงมีความสำคัญอย่างยิ่งในระบบนิเวศโอเพนซอร์ส แม้ว่าการปฏิบัติในการพัฒนาจะก้าวหน้าขึ้นก็ตาม

สถานการณ์ของ create-llm เป็นเสมือนตัวแทนของความท้าทายในอุตสาหกรรมในวงกว้าง เมื่อผู้ช่วยการเขียนโค้ด AI มีความฉลาดมากขึ้น ชุมชนจะต้องพัฒนาบรรทัดฐานใหม่ๆ รอบๆ การให้เครดิต ความโปร่งใส และสิ่งที่นับเป็นผลงานที่มีความหมาย เครื่องมือเองอาจทำงานได้ตามที่โฆษณา—มีผู้ใช้หลายคนรายงานว่าฝึกฝนโมเดลขนาดเล็กด้วยมันได้สำเร็จ—แต่บทสนทนาที่มันได้จุดประกายเกี่ยวกับจริยธรรมในการพัฒนาอาจพิสูจน์ได้ว่ามีคุณค่าไม่แพ้กันสำหรับชุมชนในการก้าวไปข้างหน้า

อ้างอิง: create-llm