แนวคิดใหม่ที่เรียกว่า deep agents ได้จุดประกายการถกเถียงอย่างเข้มข้นในชุมชนนักพัฒนา AI โดยหลายคนตั้งคำถามว่าระบบเหล่านี้เป็นตัวแทนของนวัตกรรมที่แท้จริงหรือเป็นเพียงเทคโนโลยี AI agent ที่มีอยู่แล้วที่ได้รับการออกแบบให้ดีขึ้น
คำศัพท์นี้เกิดขึ้นจากการวิเคราะห์แอปพลิเคชัน AI ที่ประสบความสำเร็จอย่าง Claude Code, Deep Research และ Manus ซึ่งแสดงประสิทธิภาพที่เหนือกว่าในงานที่ซับซ้อนและระยะยาวเมื่อเปรียบเทียบกับ AI agents พื้นฐาน ระบบเหล่านี้สามารถจัดการโปรเจกต์วิจัย งานเขียนโค้ด และงานที่ต้องการความเข้มข้นและการวางแผนอย่างต่อเนื่อง
ตัวอย่างของแอปพลิเคชัน Deep Agent
- Claude Code: ผู้ช่วย AI สำหรับการเขียนโค้ดที่มีการวางแผนรายการสิ่งที่ต้องทำและการสร้าง sub-agent
- Deep Research: ผู้ช่วยวิจัย AI สำหรับงานรวบรวมข้อมูลที่ซับซ้อน
- Manus: เอเจนต์ AI ที่ใช้ระบบไฟล์อย่างมากสำหรับการจัดการหน่วยความจำ
- Junie (JetBrains): การใช้งานเริ่มต้นของการวางแผนรายการสิ่งที่ต้องทำคุณภาพสูง
- Cursor: ฟังก์ชันรายการสิ่งที่ต้องทำที่รวมเข้ากับ UI สำหรับงานพัฒนา
สถาปัตยกรรมหลักยังคงเรียบง่าย
แม้จะมีความสามารถที่น่าประทับใจ แต่เทคโนโลジีพื้นฐานนั้นเรียบง่ายอย่างน่าประหลาด Deep agents ยังคงใช้แนวทางพื้นฐานเดียวกันกับ AI agents พื้นฐาน คือ large language model ที่ทำงานในลูปและเรียกใช้เครื่องมือตามความจำเป็น ความมหัศจรรย์ไม่ได้อยู่ที่อัลกอริทึมใหม่ที่ปฏิวัติวงการ แต่อยู่ที่การปรับปรุงสี่ประการหลักที่เปลี่ยน shallow agents ให้กลายเป็นผู้ช่วยที่มีความสามารถ
องค์ประกอบที่สำคัญที่สุดดูเหมือนจะเป็น system prompts ที่มีรายละเอียด คำแนะนำเหล่านี้อาจยาวมากและมีคำแนะนำเฉพาะเจาะจงเกี่ยวกับการใช้เครื่องมือ พร้อมด้วยตัวอย่างที่แสดงวิธีจัดการกับสถานการณ์ต่าง ๆ หากไม่มี prompts ที่ครอบคลุมเหล่านี้ agents จะสูญเสียประสิทธิภาพส่วนใหญ่ไป
องค์ประกอบหลักของ Deep Agents
องค์ประกอบ | วัตถุประสงค์ | การนำไปใช้งาน |
---|---|---|
Detailed System Prompt | ให้คำแนะนำและตัวอย่างที่ครอบคลุม | คำสั่งยาวพร้อมคำแนะนำการใช้เครื่องมือและตัวอย่าง few-shot |
Planning Tool | รักษาความมุ่งมั่นและการจัดระเบียบ | เครื่องมือรายการสิ่งที่ต้องทำแบบ no-op สำหรับ context engineering |
Sub-Agents | แบ่งงานที่ซับซ้อนออกเป็นส่วนย่อย | เอเจนต์เฉพาะทางที่มีคำสั่งที่เน้นเฉพาะและเครื่องมือที่จำกัด |
File System | จัดหาหน่วยความจำและพื้นที่ทำงาน | พื้นที่จัดเก็บถาวรสำหรับบันทึกและการทำงานร่วมกันของเอเจนต์ |
เครื่องมือวางแผนที่ไม่ทำอะไรเลย
หนึ่งในการค้นพบที่น่าสนใจที่สุดคือวิธีที่ระบบเหล่านี้ใช้เครื่องมือวางแผนแบบ no-op Claude Code ใช้เครื่องมือ todo list ที่ไม่ได้ทำการกระทำภายนอกใด ๆ จริง ๆ - มันเพียงช่วยให้ AI จัดระเบียบความคิดและรักษาความมุ่งมั่นในวัตถุประสงค์ระยะยาว แนวทางนี้ป้องกันปัญหาทั่วไปของ AI agents ที่สูญเสียการติดตามเป้าหมายหลังจากปฏิสัมพันธ์เพียงไม่กี่ครั้ง
นักพัฒนาหลายคนได้นำระบบ todo list ที่คล้ายกันไปใช้ในโปรเจกต์ของตนเอง และพบว่ามีประสิทธิภาพอย่างน่าประหลาดในการรักษา AI agents ให้อยู่ในเส้นทางที่ถูกต้องระหว่างงานที่ใช้เวลานาน Todo lists สามารถใช้โครงสร้างแบบซ้อนได้ ซึ่งทำงานได้ดีเพราะยังคงง่ายสำหรับ language models ในการประมวลผลในรูปแบบเชิงเส้น
Sub-Agents และระบบไฟล์ช่วยให้จัดการความซับซ้อนได้
ความสามารถในการสร้าง sub-agents เฉพาะทางช่วยให้ระบบเหล่านี้แบ่งงานที่ซับซ้อนออกเป็นชิ้นส่วนที่จัดการได้ Sub-agent แต่ละตัวสามารถมุ่งเน้นไปที่ด้านเฉพาะของโปรเจกต์โดยรวมในขณะที่รักษา context และคำแนะนำเฉพาะของตนเอง การแบ่งงานนี้ช่วยจัดการความซับซ้อนที่อาจทำให้ agent เดียวรับมือไม่ไหว
การเข้าถึงระบบไฟล์ทำหน้าที่เป็นทั้งพื้นที่ทำงานและระบบหน่วยความจำ Agents สามารถเก็บบันทึก แบ่งปันข้อมูลกับ sub-agents และรักษาบันทึกที่คงอยู่ตลอดงานที่ใช้เวลานาน ความสามารถนี้แก้ไขหนึ่งในความท้าทายที่ใหญ่ที่สุดในการออกแบบ AI agent คือการจัดการ context และข้อมูลในช่วงเวลาที่ยาวนาน
ความสงสัยของชุมชนและความเป็นจริงในการนำไปใช้
ชุมชนนักพัฒนายังคงแบ่งแยกเกี่ยวกับว่า deep agents สมควรได้รับการยอมรับเป็นหมวดหมู่ที่แตกต่างหรือไม่ นักวิจารณ์โต้แย้งว่าคำศัพท์นี้เป็นการใช้คำทางการตลาดที่ไม่จำเป็นสำหรับ traditional agents ที่ได้รับการนำไปใช้อย่างดี พวกเขาชี้ให้เห็นว่าสถาปัตยกรรมหลักแบบ loop-and-tools ไม่ได้เปลี่ยนแปลงอย่างพื้นฐาน
Deep agents = agents with planning + agents as tools => so regular agents. I hate how LangChain has always tried to make things that are simple seem very complicated.
อย่างไรก็ตาม ผู้สนับสนุนเน้นย้ำว่าการรวมกันของคุณสมบัติเฉพาะสร้างความสามารถที่แตกต่างกันในเชิงคุณภาพ การรวม prompts ที่มีรายละเอียด เครื่องมือวางแผน sub-agents และระบบไฟล์ผลิตผลลัพธ์ที่เกินกว่าสิ่งที่การนำ basic agent ไปใช้สามารถทำได้
ความท้าทายในการนำไปใช้จริง
แม้ว่าแนวคิดอาจเรียบง่าย แต่นักพัฒนาสังเกตว่าการสร้างระบบ agent ที่พร้อมใช้งานจริงเกี่ยวข้องกับความท้าทายทางวิศวกรรมที่สำคัญ ปัญหาอย่าง multi-tenancy, streaming responses, cancellation handling และการหาส่วนผสมที่เหมาะสมของเครื่องมือต้องการความเชี่ยวชาญอย่างมากในการแก้ไขอย่างเหมาะสม
การนำไปใช้แบบ open-source หลายแบบได้เกิดขึ้น รวมถึงโปรเจกต์สุดสัปดาห์และ frameworks ที่ครอบคลุมมากขึ้น เครื่องมือเหล่านี้มีเป้าหมายเพื่อทำให้ความสามารถของ deep agent เข้าถึงได้สำหรับนักพัฒนาที่ทำงานกับแอปพลิเคชันเฉพาะทางในอุตสาหกรรมต่าง ๆ
บทสรุป
การถกเถียงเรื่อง deep agents เน้นย้ำความจริงที่สำคัญในการพัฒนา AI บางครั้งนวัตกรรมที่มีประสิทธิภาพมากที่สุดมาจากวิศวกรรมที่มีความคิดมากกว่าการพัฒนาอัลกอริทึม ไม่ว่าคำศัพท์จะติดหรือไม่ เทคนิคที่กำลังถูกหารือแสดงถึงความก้าวหน้าในทางปฏิบัติในการทำให้ AI agents มีความสามารถและความน่าเชื่อถือมากขึ้นสำหรับแอปพลิเคชันในโลกแห่งความเป็นจริง
การถกเถียงยังสะท้อนความตึงเครียดที่กว้างขึ้นในชุมชน AI เกี่ยวกับการตลาดเทียบกับสาระสำคัญ และว่าการปรับปรุงแบบค่อยเป็นค่อยไปสมควรได้รับชื่อหมวดหมู่ใหม่หรือไม่ โดยไม่คำนึงถึงแบบแผนการตั้งชื่อ การมุ่งเน้นไปที่การวางแผน การจัดการ context และการแยกย่อยงานให้ข้อมูลเชิงลึกที่มีค่าสำหรับทุกคนที่สร้างระบบ AI agent
อ้างอิง: Deep Agents