นักพัฒนาสร้าง "โรงงาน AI" โดยใช้โมเดล Claude หลายตัวเพื่อสร้างและตรวจสอบโค้ดอัตโนมัติ

ทีมชุมชน BigGo
นักพัฒนาสร้าง "โรงงาน AI" โดยใช้โมเดล Claude หลายตัวเพื่อสร้างและตรวจสอบโค้ดอัตโนมัติ

นักพัฒนาจำนวนมากขึ้นเรื่อยๆ กำลังทดลองใช้เวิร์กโฟลว์ AI ที่ซับซ้อน ซึ่งใช้โมเดลภาษาหลายตัวทำงานร่วมกันเพื่อวางแผน เขียน และตรวจสอบโค้ดอัตโนมัติ แนวทางนี้ที่เรียกว่าโรงงาน AI แสดงถึงการเปลี่ยนแปลงจากการช่วยเหลือด้วย AI แบบง่ายๆ ไปสู่ไปป์ไลน์การพัฒนาอัตโนมัติที่ซับซ้อน

แนวทางโรงงาน: หลายโมเดล บทบาทเฉพาะทาง

แนวคิดหลักเกี่ยวข้องกับการมอบหมายบทบาทเฉพาะในกระบวนการพัฒนาให้กับโมเดล AI ต่างๆ การตั้งค่าของนักพัฒนาคนหนึ่งใช้โมเดล o3 ของ Claude สำหรับการวางแผน Sonnet 4 สำหรับการดำเนินการ และทั้งสองโมเดลสำหรับการตรวจสอบ แต่ละโมเดลทำงานใน git worktrees แยกกัน ทำให้สามารถพัฒนาฟีเจอร์หลายอย่างพร้อมกันได้โดยไม่รบกวนกัน

เวิร์กโฟลว์ปฏิบัติตามกระบวนการสามขั้นตอน: ขั้นแรก o3 สร้างแผนการดำเนินงานโดยละเอียดตามความต้องการระดับสูง ต่อมา โมเดลดำเนินการเขียนโค้ดจริงตามแผนเหล่านี้ โดยทำการ commit ในแต่ละขั้นตอนเพื่อให้ rollback ได้ง่าย สุดท้าย โมเดลตรวจสอบจะตรวจสอบผลลัพธ์เทียบกับความต้องการเดิม โดยปัญหาใดๆ จะถูกส่งกลับไปยังเทมเพลตการวางแผนแทนที่จะแก้ไขด้วยตนเอง

Git worktrees: ฟีเจอร์ของ Git ที่อนุญาตให้มีไดเรกทอรีการทำงานหลายอันจากรีโพซิทอรีเดียวกัน ทำให้สามารถพัฒนาแบบขนานในบรานช์ต่างๆ ได้

ส่วนประกอบของเวิร์กโฟลว์ AI Factory:

  • โมเดลการวางแผน: Claude o3 สำหรับสร้างแผนการดำเนินงานและถามคำถามเพื่อขอความชัดเจน
  • โมเดลการดำเนินงาน: Sonnet 3.7 หรือ Sonnet 4 สำหรับเขียนโค้ดตามแผนที่กำหนด
  • โมเดลการตรวจสอบ: Sonnet 4 และ o3 สำหรับตรวจสอบโค้ดให้ตรงกับข้อกำหนดเดิม
  • โครงสร้างพื้นฐาน: Git worktrees สำหรับการพัฒนาแบบขนาน, MCP (Model Context Protocol) สำหรับการรวมเครื่องมือ

แก้ไขอินพุต ไม่ใช่เอาต์พุต: ปรัชญาการพัฒนาใหม่

การเปลี่ยนแปลงที่สำคัญที่สุดในแนวทางนี้คือหลักการที่ไม่เคยแก้ไขโค้ดที่สร้างขึ้นด้วยตนเอง เมื่อมีสิ่งผิดพลาด นักพัฒนาจะปรับพรอมต์ แผน หรือการเลือกโมเดลแทนที่จะแพตช์เอาต์พุตโดยตรง สิ่งนี้สร้างระบบที่ปรับปรุงตัวเองได้ ซึ่งบทเรียนที่ได้จากความล้มเหลวจะปรับปรุงการสร้างโค้ดในอนาคตโดยอัตโนมัติ

การสนทนาในชุมชนเผยให้เห็นประสบการณ์ที่หลากหลายกับวิธีการนี้ นักพัฒนาบางคนรายงานความสำเร็จกับโปรเจกต์ส่วนตัวและโค้ดเบสขนาดเล็ก ในขณะที่คนอื่นๆ ประสบปัญหาความสม่ำเสมอเมื่อมีเอเจนต์ AI หลายตัวทำงานในโปรเจกต์เดียวกัน ความท้าทายจะเห็นได้ชัดเจนโดยเฉพาะในระบบการผลิตขนาดใหญ่ที่เอเจนต์ AI ต่างๆ อาจมีแนวคิดทางสถาปัตยกรรมที่ขัดแย้งกัน

ข้อจำกัดหลักที่ระบุโดยชุมชน:

  • ปัญหาความสอดคล้อง: เอเจนต์หลายตัวสร้างการตัดสินใจด้านสถาปัตยกรรมที่ขัดแย้งกัน
  • การจัดการบริบท: ไฟล์คำแนะนำสามารถขยายไปถึงหลายพันบรรทัด ทำให้กินพื้นที่หน้าต่างบริบท
  • ความพร้อมสำหรับการใช้งานจริง: ประสบปัญหาในการดีบักที่ซับซ้อนและการรวมโค้ดเก่า
  • ความเชี่ยวชาญเฉพาะด้าน: ประสิทธิภาพจำกัดสำหรับปัญหาใหม่ที่ไม่มีในข้อมูลการฝึก

ข้อกังวลเรื่องต้นทุนและความสามารถในการขยายขนาด

ด้านการเงินของการรันโมเดล AI หลายตัวพร้อมกันได้จุดประกายการถกเถียงอย่างมาก ในขณะที่นักพัฒนาบางคนรายงานการใช้จ่ายต่ำกว่า 1 ดอลลาร์สหรัฐ สำหรับการปรึกษาโมเดลรองผ่านบริการอย่าง OpenRouter คนอื่นๆ ที่ใช้แพ็กเกจ Max ของ Claude ราคา 200 ดอลลาร์สหรัฐ พบว่าตัวเองใช้ลิมิตรายวันหมดอย่างรวดเร็วเมื่อรันเอเจนต์แบบขนาน

คำถามเรื่องความสามารถในการขยายขนาดขยายไปเกินกว่าต้นทุนถึงคุณภาพของโค้ด นักพัฒนาที่มีประสบการณ์หลายคนสังเกตว่าแม้โรงงาน AI จะทำงานได้ดีสำหรับงานประจำและโปรเจกต์ greenfield แต่ก็ประสบปัญหากับการดีบักที่ซับซ้อน การรวมโค้ดเก่า และปัญหาเฉพาะโดเมนที่ต้องการความเชี่ยวชาญทางเทคนิคเชิงลึก

การเปรียบเทียบต้นทุนสำหรับการพัฒนา AI:

  • Claude Max Subscription: $200 USD ต่อเดือน พร้อมขีดจำกัดการใช้งานสูง
  • Claude Pro Subscription: $20 USD ต่อเดือน พร้อมขีดจำกัดที่เข้มงวดกว่า
  • OpenRouter API: ค่าใช้จ่ายประมาณ $0.50 USD จากเครดิต $10 USD สำหรับการปรึกษาโมเดลรอง
  • ต้นทุน API แบบดั้งเดิม: แพงกว่า Claude Code subscription ถึง 10 เท่าสำหรับการใช้งานเทียบเท่า

การใช้งานในโลกจริงและข้อจำกัด

ผู้ใช้งานแรกๆ พบความสำเร็จในกรณีการใช้งานเฉพาะ แนวทางนี้แสดงให้เห็นความสัญญาในการสร้างโค้ด boilerplate การรวม API และเอกสาร อย่างไรก็ตาม ข้อเสนอแนะจากชุมชนชี้ให้เห็นข้อจำกัดที่สำคัญเมื่อต้องจัดการกับระบบการผลิตที่ซับซ้อน สถานการณ์การดีบักที่ซับซ้อน หรือความท้าทายทางเทคนิคใหม่ๆ ที่ไม่ได้แสดงให้เห็นอย่างดีในข้อมูลการฝึก

ส่วนใหญ่ในชีวิตประจำวันของฉันอยู่ใน clojure ฉันมักจะใช้ sonnet 4 เพื่อให้วงเล็บถูกต้อง

เทคโนโลยีนี้ดูเหมือนจะมีประสิทธิภาพมากที่สุดสำหรับนักพัฒนาที่สามารถให้คำแนะนำทางสถาปัตยกรรมที่แข็งแกร่งในขณะที่ปล่อยให้ AI จัดการรายละเอียดการดำเนินการ สิ่งนี้ชี้ให้เห็นว่าแทนที่จะแทนที่โปรแกรมเมอร์ โรงงาน AI เหล่านี้อาจกำลังปรับเปลี่ยนบทบาทไปสู่การออกแบบระบบระดับสูงและการประกันคุณภาพ

การถกเถียงยังคงดำเนินต่อไปว่าสิ่งนี้แสดงถึงการเปลี่ยนแปลงพื้นฐานในการพัฒนาซอฟต์แวร์หรือเป็นเพียงวิวัฒนาการของเครื่องมือเขียนโค้ดที่ช่วยด้วย AI ที่มีอยู่เดิม สิ่งที่ชัดเจนคือนักพัฒนากำลังทดลองใช้เวิร์กโฟลว์ AI ที่ซับซ้อนมากขึ้นอย่างแข็งขัน ผลักดันขอบเขตของสิ่งที่เป็นไปได้ด้วยโมเดลภาษาปัจจุบัน

อ้างอิง: Building a Personal AI Factory (July 2025 snapshot)