ชุมชนนักพัฒนา AI กำลังมีการถกเถียงกันอย่างเข้มข้นว่า context engineering เป็นความก้าวหน้าที่มีความหมายในการพัฒนา AI agent หรือเป็นเพียงการนำเทคนิค prompt engineering เดิมมาห่อหุ้มด้วยชื่อใหม่
การอภิปรายมุ่งเน้นไปที่การจัดการหน่วยความจำการทำงานที่จำกัดของ large language models ( LLMs ) ซึ่งนักพัฒนาเปรียบเทียบกับ RAM ของคอมพิวเตอร์ เมื่อ AI agents จัดการกับการสนทนาที่ยาวขึ้นและงานที่ซับซ้อนมากขึ้น พวกมันจะเติม context windows ด้วยคำสั่ง ความรู้ และข้อมูลป้อนกลับจากเครื่องมืออย่างรวดเร็ว ทำให้เกิดปัญหาเช่น context poisoning และความสับสน
ปัญหาบริบทที่พบบ่อยใน AI Agents
- การปนเปื้อนบริบท (Context Poisoning): ภาพลวงตาที่ปนเปื้อนเข้าไปในบริบท
- การรบกวนบริบท (Context Distraction): บริบทที่มากเกินไปจนส่งผลกระทบต่อการฝึกโมเดล
- ความสับสนในบริบท (Context Confusion): บริบทที่ไม่จำเป็นส่งผลต่อการตอบสนอง
- การขัดแย้งของบริบท (Context Clash): ส่วนต่างๆ ของบริบทที่ขัดแย้งกันทำให้เกิดปัญหา
![]() |
---|
แผนภาพนี้เน้นให้เห็นว่าบริบทประเภทต่างๆ ไหลเข้าสู่โมเดลภาษาขนาดใหญ่อย่างไร ซึ่งเป็นแง่มุมสำคัญของการจัดการหน่วยความจำการทำงานที่จำกัดในการสนทนา AI |
ข้อพิพาทเรื่องศัพท์แบ่งแยกนักพัฒนา
ส่วนใหญ่ของชุมชนมองว่า context engineering เป็นเพียงคำพูดทางการตลาดเท่านั้น นักวิจารณ์โต้แย้งว่าการแยกแยะระหว่างการปรับปรุง context กับคำสั่งภายใน prompts ไม่ได้ทำให้การสร้างสาขาใหม่ทั้งหมดมีเหตุผล ความสงสัยลึกซึ้งมาก โดยนักพัฒนาบางคนเปรียบเทียบแนวโน้มนี้กับ layer 2 solutions ของ cryptocurrency - แนวทางที่ฟังดูเทคนิคแต่อาจไม่ได้แก้ไขปัญหาพื้นฐาน
อย่างไรก็ตาม ผู้สนับสนุนยืนยันว่า context engineering แสดงถึงการขยายขอบเขตอย่างแท้จริงเกินกว่า prompt engineering แบบดั้งเดิม พวกเขาโต้แย้งว่ามันครอบคลุมกลยุทธ์การปรับปรุงที่กว้างขึ้น รวมถึงเทคนิค context compression, selection และ isolation ที่เกินกว่าการสร้าง prompt อย่างง่าย
กลยุทธ์การออกแบบบริบท
- เขียนบริบท: การบันทึกบริบทนอกหน้าต่างบริบท
- เลือกบริบท: การดึงบริบทที่เกี่ยวข้องเข้ามาในหน้าต่างบริบท
- บีบอัดบริบท: การเก็บเฉพาะโทเค็นที่จำเป็น (เช่น การใช้ LLMLingua )
- แยกบริบท: การแบ่งบริบทเพื่อปรับปรุงประสิทธิภาพของงาน
![]() |
---|
ภาพประกอบนี้แสดงปฏิสัมพันธ์ระหว่างตัวแทน AI และสภาพแวดล้อมการประมวลผล เป็นสัญลักษณ์ของความซับซ้อนของบริบทและคำสั่งในการพัฒนา AI |
ข้อจำกัดทางเทคนิคเปิดเผยปัญหาที่ลึกกว่า
การถกเถียงเผยให้เห็นความกังวลพื้นฐานเกี่ยวกับความสามารถของ AI ในปัจจุบัน นักพัฒนารายงานการเสื่อมสภาพอย่างต่อเนื่องในประสิทธิภาพของ AI ระหว่างการสนทนาที่ยาวนาน โดยเฉพาะสังเกตว่าโมเดลเช่น GPT-4 เริ่มต้นแข็งแรงแต่เสื่อมลงภายในการตอบสนองครั้งที่ห้า รูปแบบนี้เน้นความสำคัญอย่างยิ่งของการจัดการ context ที่มีประสิทธิภาพ
งานวิจัยล่าสุดของ Apple ที่แสดงให้เห็นว่า AI ดิ้นรนกับงานการใช้เหตุผลหลายขั้นตอนเช่นปัญหา Tower of Hanoi ได้เพิ่มเชื้อเพลิงให้กับไฟ ในขณะที่บางคนปฏิเสธการศึกษาว่าเป็นการจำกัดความสามารถของ AI โดยเจตนา คนอื่นๆ เห็นว่าเป็นหลักฐานที่แสดงว่าแนวทางปัจจุบันในการจัดการ context มีข้อบกพร่องพื้นฐาน
![]() |
---|
แผนภาพนี้แสดงให้เห็นว่าบริบทใหม่อัปเดตความทรงจำที่มีอยู่อย่างไร โดยเน้นย้ำถึงความท้าทายที่ AI เผชิญในการรักษาการโต้ตอบที่สอดคล้องกันระหว่างการสนทนาที่ยาวนาน |
ความคึกคะนองของอุตสาหกรรมเทียบกับโซลูชันที่ใช้ได้จริง
ชุมชนแสดงความผิดหวังกับการแพร่กระจายของศัพท์ x-engineering ทั่วอุตสาหกรรม AI นักพัฒนาหลายคนรู้สึกว่าการสร้างชื่อที่ฟังดูเป็นมืออาชีพสำหรับเทคนิคพื้นฐานทำให้ความหมายของวิศวกรรมเองเจือจาง ความรู้สึกสะท้อนความกังวลที่กว้างขึ้นเกี่ยวกับการพัฒนาที่ขับเคลื่อนด้วยความคึกคะนองในพื้นที่ AI
เราเคยเรียกทั้งสองสิ่งนี้ว่าการใช้ Google เก่ง การเปรียบเทียบกับวิศวกรรมทั้งตลกและดูหมิ่น
แม้จะมีข้อพิพาทเรื่องศัพท์ แต่การประยุกต์ใช้จริงยังคงเกิดขึ้น นักพัฒนาบางคนรายงานความสำเร็จในการใช้ system prompts ที่มีรายละเอียดเกิน 1,500 บรรทัดสำหรับแพลตฟอร์มการเขียนโค้ดที่ช่วยด้วย AI ในขณะที่คนอื่นๆ ใช้รูปแบบ memory-bank เพื่อจัดการ context ได้อย่างมีประสิทธิภาพมากขึ้น
การค้นหาโซลูชันที่ดีกว่า
การถกเถียงสะท้อนการดิ้นรนของชุมชน AI กับข้อจำกัดทางสถาปัตยกรรมพื้นฐาน นักพัฒนาหลายคนเชื่อว่าความก้าวหน้าที่แท้จริงต้องการการปรับเปลี่ยน transformer architectures มากกว่าการซ้อนเทคนิคการจัดการบนโมเดลที่จำกัด context จนกว่าจะมีความก้าวหน้าดังกล่าว อุตสาหกรรมยังคงสร้างสิ่งที่บางคนอธิบายว่าเป็น hacks บน hacks
การอภิปราย context engineering ไม่ว่าจะเรียกชื่ออะไร เน้นความท้าทายที่สำคัญที่ AI development กำลังเผชิญ: วิธีการทำระบบที่สามารถรักษาพฤติกรรมที่สอดคล้องและมีประโยชน์ตลอดการโต้ตอบที่ยาวนานโดยไม่สูญเสียข้อมูลสำคัญหรือเกิดข้อผิดพลาด
อ้างอิง: Context Engineering for Agents