นักพัฒนาถกเถียงว่า "Deep Agents" เป็นเพียง AI Agents ทั่วไปที่มี Prompts ที่ดีกว่าหรือไม่

ทีมชุมชน BigGo
นักพัฒนาถกเถียงว่า "Deep Agents" เป็นเพียง AI Agents ทั่วไปที่มี Prompts ที่ดีกว่าหรือไม่

แนวคิดใหม่ที่เรียกว่า deep agents ได้จุดประกายการถกเถียงอย่างเข้มข้นในชุมชนนักพัฒนา AI โดยหลายคนตั้งคำถามว่าระบบเหล่านี้เป็นตัวแทนของนวัตกรรมที่แท้จริงหรือเป็นเพียงเทคโนโลยี AI agent ที่มีอยู่แล้วที่ได้รับการออกแบบให้ดีขึ้น

คำศัพท์นี้เกิดขึ้นจากการวิเคราะห์แอปพลิเคชัน AI ที่ประสบความสำเร็จอย่าง Claude Code, Deep Research และ Manus ซึ่งแสดงประสิทธิภาพที่เหนือกว่าในงานที่ซับซ้อนและระยะยาวเมื่อเปรียบเทียบกับ AI agents พื้นฐาน ระบบเหล่านี้สามารถจัดการโปรเจกต์วิจัย งานเขียนโค้ด และงานที่ต้องการความเข้มข้นและการวางแผนอย่างต่อเนื่อง

ตัวอย่างของแอปพลิเคชัน Deep Agent

  • Claude Code: ผู้ช่วย AI สำหรับการเขียนโค้ดที่มีการวางแผนรายการสิ่งที่ต้องทำและการสร้าง sub-agent
  • Deep Research: ผู้ช่วยวิจัย AI สำหรับงานรวบรวมข้อมูลที่ซับซ้อน
  • Manus: เอเจนต์ AI ที่ใช้ระบบไฟล์อย่างมากสำหรับการจัดการหน่วยความจำ
  • Junie (JetBrains): การใช้งานเริ่มต้นของการวางแผนรายการสิ่งที่ต้องทำคุณภาพสูง
  • Cursor: ฟังก์ชันรายการสิ่งที่ต้องทำที่รวมเข้ากับ UI สำหรับงานพัฒนา

สถาปัตยกรรมหลักยังคงเรียบง่าย

แม้จะมีความสามารถที่น่าประทับใจ แต่เทคโนโลジีพื้นฐานนั้นเรียบง่ายอย่างน่าประหลาด Deep agents ยังคงใช้แนวทางพื้นฐานเดียวกันกับ AI agents พื้นฐาน คือ large language model ที่ทำงานในลูปและเรียกใช้เครื่องมือตามความจำเป็น ความมหัศจรรย์ไม่ได้อยู่ที่อัลกอริทึมใหม่ที่ปฏิวัติวงการ แต่อยู่ที่การปรับปรุงสี่ประการหลักที่เปลี่ยน shallow agents ให้กลายเป็นผู้ช่วยที่มีความสามารถ

องค์ประกอบที่สำคัญที่สุดดูเหมือนจะเป็น system prompts ที่มีรายละเอียด คำแนะนำเหล่านี้อาจยาวมากและมีคำแนะนำเฉพาะเจาะจงเกี่ยวกับการใช้เครื่องมือ พร้อมด้วยตัวอย่างที่แสดงวิธีจัดการกับสถานการณ์ต่าง ๆ หากไม่มี prompts ที่ครอบคลุมเหล่านี้ agents จะสูญเสียประสิทธิภาพส่วนใหญ่ไป

องค์ประกอบหลักของ Deep Agents

องค์ประกอบ วัตถุประสงค์ การนำไปใช้งาน
Detailed System Prompt ให้คำแนะนำและตัวอย่างที่ครอบคลุม คำสั่งยาวพร้อมคำแนะนำการใช้เครื่องมือและตัวอย่าง few-shot
Planning Tool รักษาความมุ่งมั่นและการจัดระเบียบ เครื่องมือรายการสิ่งที่ต้องทำแบบ no-op สำหรับ context engineering
Sub-Agents แบ่งงานที่ซับซ้อนออกเป็นส่วนย่อย เอเจนต์เฉพาะทางที่มีคำสั่งที่เน้นเฉพาะและเครื่องมือที่จำกัด
File System จัดหาหน่วยความจำและพื้นที่ทำงาน พื้นที่จัดเก็บถาวรสำหรับบันทึกและการทำงานร่วมกันของเอเจนต์

เครื่องมือวางแผนที่ไม่ทำอะไรเลย

หนึ่งในการค้นพบที่น่าสนใจที่สุดคือวิธีที่ระบบเหล่านี้ใช้เครื่องมือวางแผนแบบ no-op Claude Code ใช้เครื่องมือ todo list ที่ไม่ได้ทำการกระทำภายนอกใด ๆ จริง ๆ - มันเพียงช่วยให้ AI จัดระเบียบความคิดและรักษาความมุ่งมั่นในวัตถุประสงค์ระยะยาว แนวทางนี้ป้องกันปัญหาทั่วไปของ AI agents ที่สูญเสียการติดตามเป้าหมายหลังจากปฏิสัมพันธ์เพียงไม่กี่ครั้ง

นักพัฒนาหลายคนได้นำระบบ todo list ที่คล้ายกันไปใช้ในโปรเจกต์ของตนเอง และพบว่ามีประสิทธิภาพอย่างน่าประหลาดในการรักษา AI agents ให้อยู่ในเส้นทางที่ถูกต้องระหว่างงานที่ใช้เวลานาน Todo lists สามารถใช้โครงสร้างแบบซ้อนได้ ซึ่งทำงานได้ดีเพราะยังคงง่ายสำหรับ language models ในการประมวลผลในรูปแบบเชิงเส้น

Sub-Agents และระบบไฟล์ช่วยให้จัดการความซับซ้อนได้

ความสามารถในการสร้าง sub-agents เฉพาะทางช่วยให้ระบบเหล่านี้แบ่งงานที่ซับซ้อนออกเป็นชิ้นส่วนที่จัดการได้ Sub-agent แต่ละตัวสามารถมุ่งเน้นไปที่ด้านเฉพาะของโปรเจกต์โดยรวมในขณะที่รักษา context และคำแนะนำเฉพาะของตนเอง การแบ่งงานนี้ช่วยจัดการความซับซ้อนที่อาจทำให้ agent เดียวรับมือไม่ไหว

การเข้าถึงระบบไฟล์ทำหน้าที่เป็นทั้งพื้นที่ทำงานและระบบหน่วยความจำ Agents สามารถเก็บบันทึก แบ่งปันข้อมูลกับ sub-agents และรักษาบันทึกที่คงอยู่ตลอดงานที่ใช้เวลานาน ความสามารถนี้แก้ไขหนึ่งในความท้าทายที่ใหญ่ที่สุดในการออกแบบ AI agent คือการจัดการ context และข้อมูลในช่วงเวลาที่ยาวนาน

ความสงสัยของชุมชนและความเป็นจริงในการนำไปใช้

ชุมชนนักพัฒนายังคงแบ่งแยกเกี่ยวกับว่า deep agents สมควรได้รับการยอมรับเป็นหมวดหมู่ที่แตกต่างหรือไม่ นักวิจารณ์โต้แย้งว่าคำศัพท์นี้เป็นการใช้คำทางการตลาดที่ไม่จำเป็นสำหรับ traditional agents ที่ได้รับการนำไปใช้อย่างดี พวกเขาชี้ให้เห็นว่าสถาปัตยกรรมหลักแบบ loop-and-tools ไม่ได้เปลี่ยนแปลงอย่างพื้นฐาน

Deep agents = agents with planning + agents as tools => so regular agents. I hate how LangChain has always tried to make things that are simple seem very complicated.

อย่างไรก็ตาม ผู้สนับสนุนเน้นย้ำว่าการรวมกันของคุณสมบัติเฉพาะสร้างความสามารถที่แตกต่างกันในเชิงคุณภาพ การรวม prompts ที่มีรายละเอียด เครื่องมือวางแผน sub-agents และระบบไฟล์ผลิตผลลัพธ์ที่เกินกว่าสิ่งที่การนำ basic agent ไปใช้สามารถทำได้

ความท้าทายในการนำไปใช้จริง

แม้ว่าแนวคิดอาจเรียบง่าย แต่นักพัฒนาสังเกตว่าการสร้างระบบ agent ที่พร้อมใช้งานจริงเกี่ยวข้องกับความท้าทายทางวิศวกรรมที่สำคัญ ปัญหาอย่าง multi-tenancy, streaming responses, cancellation handling และการหาส่วนผสมที่เหมาะสมของเครื่องมือต้องการความเชี่ยวชาญอย่างมากในการแก้ไขอย่างเหมาะสม

การนำไปใช้แบบ open-source หลายแบบได้เกิดขึ้น รวมถึงโปรเจกต์สุดสัปดาห์และ frameworks ที่ครอบคลุมมากขึ้น เครื่องมือเหล่านี้มีเป้าหมายเพื่อทำให้ความสามารถของ deep agent เข้าถึงได้สำหรับนักพัฒนาที่ทำงานกับแอปพลิเคชันเฉพาะทางในอุตสาหกรรมต่าง ๆ

บทสรุป

การถกเถียงเรื่อง deep agents เน้นย้ำความจริงที่สำคัญในการพัฒนา AI บางครั้งนวัตกรรมที่มีประสิทธิภาพมากที่สุดมาจากวิศวกรรมที่มีความคิดมากกว่าการพัฒนาอัลกอริทึม ไม่ว่าคำศัพท์จะติดหรือไม่ เทคนิคที่กำลังถูกหารือแสดงถึงความก้าวหน้าในทางปฏิบัติในการทำให้ AI agents มีความสามารถและความน่าเชื่อถือมากขึ้นสำหรับแอปพลิเคชันในโลกแห่งความเป็นจริง

การถกเถียงยังสะท้อนความตึงเครียดที่กว้างขึ้นในชุมชน AI เกี่ยวกับการตลาดเทียบกับสาระสำคัญ และว่าการปรับปรุงแบบค่อยเป็นค่อยไปสมควรได้รับชื่อหมวดหมู่ใหม่หรือไม่ โดยไม่คำนึงถึงแบบแผนการตั้งชื่อ การมุ่งเน้นไปที่การวางแผน การจัดการ context และการแยกย่อยงานให้ข้อมูลเชิงลึกที่มีค่าสำหรับทุกคนที่สร้างระบบ AI agent

อ้างอิง: Deep Agents