นักพัฒนาจำนวนมากขึ้นเรื่อยๆ กำลังทดลองใช้เวิร์กโฟลว์ AI ที่ซับซ้อน ซึ่งใช้โมเดลภาษาหลายตัวทำงานร่วมกันเพื่อวางแผน เขียน และตรวจสอบโค้ดอัตโนมัติ แนวทางนี้ที่เรียกว่าโรงงาน AI แสดงถึงการเปลี่ยนแปลงจากการช่วยเหลือด้วย AI แบบง่ายๆ ไปสู่ไปป์ไลน์การพัฒนาอัตโนมัติที่ซับซ้อน
แนวทางโรงงาน: หลายโมเดล บทบาทเฉพาะทาง
แนวคิดหลักเกี่ยวข้องกับการมอบหมายบทบาทเฉพาะในกระบวนการพัฒนาให้กับโมเดล AI ต่างๆ การตั้งค่าของนักพัฒนาคนหนึ่งใช้โมเดล o3 ของ Claude สำหรับการวางแผน Sonnet 4 สำหรับการดำเนินการ และทั้งสองโมเดลสำหรับการตรวจสอบ แต่ละโมเดลทำงานใน git worktrees แยกกัน ทำให้สามารถพัฒนาฟีเจอร์หลายอย่างพร้อมกันได้โดยไม่รบกวนกัน
เวิร์กโฟลว์ปฏิบัติตามกระบวนการสามขั้นตอน: ขั้นแรก o3 สร้างแผนการดำเนินงานโดยละเอียดตามความต้องการระดับสูง ต่อมา โมเดลดำเนินการเขียนโค้ดจริงตามแผนเหล่านี้ โดยทำการ commit ในแต่ละขั้นตอนเพื่อให้ rollback ได้ง่าย สุดท้าย โมเดลตรวจสอบจะตรวจสอบผลลัพธ์เทียบกับความต้องการเดิม โดยปัญหาใดๆ จะถูกส่งกลับไปยังเทมเพลตการวางแผนแทนที่จะแก้ไขด้วยตนเอง
Git worktrees: ฟีเจอร์ของ Git ที่อนุญาตให้มีไดเรกทอรีการทำงานหลายอันจากรีโพซิทอรีเดียวกัน ทำให้สามารถพัฒนาแบบขนานในบรานช์ต่างๆ ได้
ส่วนประกอบของเวิร์กโฟลว์ AI Factory:
- โมเดลการวางแผน: Claude o3 สำหรับสร้างแผนการดำเนินงานและถามคำถามเพื่อขอความชัดเจน
- โมเดลการดำเนินงาน: Sonnet 3.7 หรือ Sonnet 4 สำหรับเขียนโค้ดตามแผนที่กำหนด
- โมเดลการตรวจสอบ: Sonnet 4 และ o3 สำหรับตรวจสอบโค้ดให้ตรงกับข้อกำหนดเดิม
- โครงสร้างพื้นฐาน: Git worktrees สำหรับการพัฒนาแบบขนาน, MCP (Model Context Protocol) สำหรับการรวมเครื่องมือ
แก้ไขอินพุต ไม่ใช่เอาต์พุต: ปรัชญาการพัฒนาใหม่
การเปลี่ยนแปลงที่สำคัญที่สุดในแนวทางนี้คือหลักการที่ไม่เคยแก้ไขโค้ดที่สร้างขึ้นด้วยตนเอง เมื่อมีสิ่งผิดพลาด นักพัฒนาจะปรับพรอมต์ แผน หรือการเลือกโมเดลแทนที่จะแพตช์เอาต์พุตโดยตรง สิ่งนี้สร้างระบบที่ปรับปรุงตัวเองได้ ซึ่งบทเรียนที่ได้จากความล้มเหลวจะปรับปรุงการสร้างโค้ดในอนาคตโดยอัตโนมัติ
การสนทนาในชุมชนเผยให้เห็นประสบการณ์ที่หลากหลายกับวิธีการนี้ นักพัฒนาบางคนรายงานความสำเร็จกับโปรเจกต์ส่วนตัวและโค้ดเบสขนาดเล็ก ในขณะที่คนอื่นๆ ประสบปัญหาความสม่ำเสมอเมื่อมีเอเจนต์ AI หลายตัวทำงานในโปรเจกต์เดียวกัน ความท้าทายจะเห็นได้ชัดเจนโดยเฉพาะในระบบการผลิตขนาดใหญ่ที่เอเจนต์ AI ต่างๆ อาจมีแนวคิดทางสถาปัตยกรรมที่ขัดแย้งกัน
ข้อจำกัดหลักที่ระบุโดยชุมชน:
- ปัญหาความสอดคล้อง: เอเจนต์หลายตัวสร้างการตัดสินใจด้านสถาปัตยกรรมที่ขัดแย้งกัน
- การจัดการบริบท: ไฟล์คำแนะนำสามารถขยายไปถึงหลายพันบรรทัด ทำให้กินพื้นที่หน้าต่างบริบท
- ความพร้อมสำหรับการใช้งานจริง: ประสบปัญหาในการดีบักที่ซับซ้อนและการรวมโค้ดเก่า
- ความเชี่ยวชาญเฉพาะด้าน: ประสิทธิภาพจำกัดสำหรับปัญหาใหม่ที่ไม่มีในข้อมูลการฝึก
ข้อกังวลเรื่องต้นทุนและความสามารถในการขยายขนาด
ด้านการเงินของการรันโมเดล AI หลายตัวพร้อมกันได้จุดประกายการถกเถียงอย่างมาก ในขณะที่นักพัฒนาบางคนรายงานการใช้จ่ายต่ำกว่า 1 ดอลลาร์สหรัฐ สำหรับการปรึกษาโมเดลรองผ่านบริการอย่าง OpenRouter คนอื่นๆ ที่ใช้แพ็กเกจ Max ของ Claude ราคา 200 ดอลลาร์สหรัฐ พบว่าตัวเองใช้ลิมิตรายวันหมดอย่างรวดเร็วเมื่อรันเอเจนต์แบบขนาน
คำถามเรื่องความสามารถในการขยายขนาดขยายไปเกินกว่าต้นทุนถึงคุณภาพของโค้ด นักพัฒนาที่มีประสบการณ์หลายคนสังเกตว่าแม้โรงงาน AI จะทำงานได้ดีสำหรับงานประจำและโปรเจกต์ greenfield แต่ก็ประสบปัญหากับการดีบักที่ซับซ้อน การรวมโค้ดเก่า และปัญหาเฉพาะโดเมนที่ต้องการความเชี่ยวชาญทางเทคนิคเชิงลึก
การเปรียบเทียบต้นทุนสำหรับการพัฒนา AI:
- Claude Max Subscription: $200 USD ต่อเดือน พร้อมขีดจำกัดการใช้งานสูง
- Claude Pro Subscription: $20 USD ต่อเดือน พร้อมขีดจำกัดที่เข้มงวดกว่า
- OpenRouter API: ค่าใช้จ่ายประมาณ $0.50 USD จากเครดิต $10 USD สำหรับการปรึกษาโมเดลรอง
- ต้นทุน API แบบดั้งเดิม: แพงกว่า Claude Code subscription ถึง 10 เท่าสำหรับการใช้งานเทียบเท่า
การใช้งานในโลกจริงและข้อจำกัด
ผู้ใช้งานแรกๆ พบความสำเร็จในกรณีการใช้งานเฉพาะ แนวทางนี้แสดงให้เห็นความสัญญาในการสร้างโค้ด boilerplate การรวม API และเอกสาร อย่างไรก็ตาม ข้อเสนอแนะจากชุมชนชี้ให้เห็นข้อจำกัดที่สำคัญเมื่อต้องจัดการกับระบบการผลิตที่ซับซ้อน สถานการณ์การดีบักที่ซับซ้อน หรือความท้าทายทางเทคนิคใหม่ๆ ที่ไม่ได้แสดงให้เห็นอย่างดีในข้อมูลการฝึก
ส่วนใหญ่ในชีวิตประจำวันของฉันอยู่ใน clojure ฉันมักจะใช้ sonnet 4 เพื่อให้วงเล็บถูกต้อง
เทคโนโลยีนี้ดูเหมือนจะมีประสิทธิภาพมากที่สุดสำหรับนักพัฒนาที่สามารถให้คำแนะนำทางสถาปัตยกรรมที่แข็งแกร่งในขณะที่ปล่อยให้ AI จัดการรายละเอียดการดำเนินการ สิ่งนี้ชี้ให้เห็นว่าแทนที่จะแทนที่โปรแกรมเมอร์ โรงงาน AI เหล่านี้อาจกำลังปรับเปลี่ยนบทบาทไปสู่การออกแบบระบบระดับสูงและการประกันคุณภาพ
การถกเถียงยังคงดำเนินต่อไปว่าสิ่งนี้แสดงถึงการเปลี่ยนแปลงพื้นฐานในการพัฒนาซอฟต์แวร์หรือเป็นเพียงวิวัฒนาการของเครื่องมือเขียนโค้ดที่ช่วยด้วย AI ที่มีอยู่เดิม สิ่งที่ชัดเจนคือนักพัฒนากำลังทดลองใช้เวิร์กโฟลว์ AI ที่ซับซ้อนมากขึ้นอย่างแข็งขัน ผลักดันขอบเขตของสิ่งที่เป็นไปได้ด้วยโมเดลภาษาปัจจุบัน
อ้างอิง: Building a Personal AI Factory (July 2025 snapshot)