นักพัฒนา AI ถกเถียงว่า "Context Engineering" เป็นนวัตกรรมจริงหรือแค่ Prompt Engineering ที่เปลี่ยนชื่อใหม่

ทีมชุมชน BigGo
นักพัฒนา AI ถกเถียงว่า "Context Engineering" เป็นนวัตกรรมจริงหรือแค่ Prompt Engineering ที่เปลี่ยนชื่อใหม่

ชุมชนนักพัฒนา AI กำลังมีการถกเถียงกันอย่างเข้มข้นว่า context engineering เป็นความก้าวหน้าที่มีความหมายในการพัฒนา AI agent หรือเป็นเพียงการนำเทคนิค prompt engineering เดิมมาห่อหุ้มด้วยชื่อใหม่

การอภิปรายมุ่งเน้นไปที่การจัดการหน่วยความจำการทำงานที่จำกัดของ large language models ( LLMs ) ซึ่งนักพัฒนาเปรียบเทียบกับ RAM ของคอมพิวเตอร์ เมื่อ AI agents จัดการกับการสนทนาที่ยาวขึ้นและงานที่ซับซ้อนมากขึ้น พวกมันจะเติม context windows ด้วยคำสั่ง ความรู้ และข้อมูลป้อนกลับจากเครื่องมืออย่างรวดเร็ว ทำให้เกิดปัญหาเช่น context poisoning และความสับสน

ปัญหาบริบทที่พบบ่อยใน AI Agents

  • การปนเปื้อนบริบท (Context Poisoning): ภาพลวงตาที่ปนเปื้อนเข้าไปในบริบท
  • การรบกวนบริบท (Context Distraction): บริบทที่มากเกินไปจนส่งผลกระทบต่อการฝึกโมเดล
  • ความสับสนในบริบท (Context Confusion): บริบทที่ไม่จำเป็นส่งผลต่อการตอบสนอง
  • การขัดแย้งของบริบท (Context Clash): ส่วนต่างๆ ของบริบทที่ขัดแย้งกันทำให้เกิดปัญหา
แผนภาพนี้เน้นให้เห็นว่าบริบทประเภทต่างๆ ไหลเข้าสู่โมเดลภาษาขนาดใหญ่อย่างไร ซึ่งเป็นแง่มุมสำคัญของการจัดการหน่วยความจำการทำงานที่จำกัดในการสนทนา AI
แผนภาพนี้เน้นให้เห็นว่าบริบทประเภทต่างๆ ไหลเข้าสู่โมเดลภาษาขนาดใหญ่อย่างไร ซึ่งเป็นแง่มุมสำคัญของการจัดการหน่วยความจำการทำงานที่จำกัดในการสนทนา AI

ข้อพิพาทเรื่องศัพท์แบ่งแยกนักพัฒนา

ส่วนใหญ่ของชุมชนมองว่า context engineering เป็นเพียงคำพูดทางการตลาดเท่านั้น นักวิจารณ์โต้แย้งว่าการแยกแยะระหว่างการปรับปรุง context กับคำสั่งภายใน prompts ไม่ได้ทำให้การสร้างสาขาใหม่ทั้งหมดมีเหตุผล ความสงสัยลึกซึ้งมาก โดยนักพัฒนาบางคนเปรียบเทียบแนวโน้มนี้กับ layer 2 solutions ของ cryptocurrency - แนวทางที่ฟังดูเทคนิคแต่อาจไม่ได้แก้ไขปัญหาพื้นฐาน

อย่างไรก็ตาม ผู้สนับสนุนยืนยันว่า context engineering แสดงถึงการขยายขอบเขตอย่างแท้จริงเกินกว่า prompt engineering แบบดั้งเดิม พวกเขาโต้แย้งว่ามันครอบคลุมกลยุทธ์การปรับปรุงที่กว้างขึ้น รวมถึงเทคนิค context compression, selection และ isolation ที่เกินกว่าการสร้าง prompt อย่างง่าย

กลยุทธ์การออกแบบบริบท

  • เขียนบริบท: การบันทึกบริบทนอกหน้าต่างบริบท
  • เลือกบริบท: การดึงบริบทที่เกี่ยวข้องเข้ามาในหน้าต่างบริบท
  • บีบอัดบริบท: การเก็บเฉพาะโทเค็นที่จำเป็น (เช่น การใช้ LLMLingua )
  • แยกบริบท: การแบ่งบริบทเพื่อปรับปรุงประสิทธิภาพของงาน
ภาพประกอบนี้แสดงปฏิสัมพันธ์ระหว่างตัวแทน AI และสภาพแวดล้อมการประมวลผล เป็นสัญลักษณ์ของความซับซ้อนของบริบทและคำสั่งในการพัฒนา AI
ภาพประกอบนี้แสดงปฏิสัมพันธ์ระหว่างตัวแทน AI และสภาพแวดล้อมการประมวลผล เป็นสัญลักษณ์ของความซับซ้อนของบริบทและคำสั่งในการพัฒนา AI

ข้อจำกัดทางเทคนิคเปิดเผยปัญหาที่ลึกกว่า

การถกเถียงเผยให้เห็นความกังวลพื้นฐานเกี่ยวกับความสามารถของ AI ในปัจจุบัน นักพัฒนารายงานการเสื่อมสภาพอย่างต่อเนื่องในประสิทธิภาพของ AI ระหว่างการสนทนาที่ยาวนาน โดยเฉพาะสังเกตว่าโมเดลเช่น GPT-4 เริ่มต้นแข็งแรงแต่เสื่อมลงภายในการตอบสนองครั้งที่ห้า รูปแบบนี้เน้นความสำคัญอย่างยิ่งของการจัดการ context ที่มีประสิทธิภาพ

งานวิจัยล่าสุดของ Apple ที่แสดงให้เห็นว่า AI ดิ้นรนกับงานการใช้เหตุผลหลายขั้นตอนเช่นปัญหา Tower of Hanoi ได้เพิ่มเชื้อเพลิงให้กับไฟ ในขณะที่บางคนปฏิเสธการศึกษาว่าเป็นการจำกัดความสามารถของ AI โดยเจตนา คนอื่นๆ เห็นว่าเป็นหลักฐานที่แสดงว่าแนวทางปัจจุบันในการจัดการ context มีข้อบกพร่องพื้นฐาน

แผนภาพนี้แสดงให้เห็นว่าบริบทใหม่อัปเดตความทรงจำที่มีอยู่อย่างไร โดยเน้นย้ำถึงความท้าทายที่ AI เผชิญในการรักษาการโต้ตอบที่สอดคล้องกันระหว่างการสนทนาที่ยาวนาน
แผนภาพนี้แสดงให้เห็นว่าบริบทใหม่อัปเดตความทรงจำที่มีอยู่อย่างไร โดยเน้นย้ำถึงความท้าทายที่ AI เผชิญในการรักษาการโต้ตอบที่สอดคล้องกันระหว่างการสนทนาที่ยาวนาน

ความคึกคะนองของอุตสาหกรรมเทียบกับโซลูชันที่ใช้ได้จริง

ชุมชนแสดงความผิดหวังกับการแพร่กระจายของศัพท์ x-engineering ทั่วอุตสาหกรรม AI นักพัฒนาหลายคนรู้สึกว่าการสร้างชื่อที่ฟังดูเป็นมืออาชีพสำหรับเทคนิคพื้นฐานทำให้ความหมายของวิศวกรรมเองเจือจาง ความรู้สึกสะท้อนความกังวลที่กว้างขึ้นเกี่ยวกับการพัฒนาที่ขับเคลื่อนด้วยความคึกคะนองในพื้นที่ AI

เราเคยเรียกทั้งสองสิ่งนี้ว่าการใช้ Google เก่ง การเปรียบเทียบกับวิศวกรรมทั้งตลกและดูหมิ่น

แม้จะมีข้อพิพาทเรื่องศัพท์ แต่การประยุกต์ใช้จริงยังคงเกิดขึ้น นักพัฒนาบางคนรายงานความสำเร็จในการใช้ system prompts ที่มีรายละเอียดเกิน 1,500 บรรทัดสำหรับแพลตฟอร์มการเขียนโค้ดที่ช่วยด้วย AI ในขณะที่คนอื่นๆ ใช้รูปแบบ memory-bank เพื่อจัดการ context ได้อย่างมีประสิทธิภาพมากขึ้น

การค้นหาโซลูชันที่ดีกว่า

การถกเถียงสะท้อนการดิ้นรนของชุมชน AI กับข้อจำกัดทางสถาปัตยกรรมพื้นฐาน นักพัฒนาหลายคนเชื่อว่าความก้าวหน้าที่แท้จริงต้องการการปรับเปลี่ยน transformer architectures มากกว่าการซ้อนเทคนิคการจัดการบนโมเดลที่จำกัด context จนกว่าจะมีความก้าวหน้าดังกล่าว อุตสาหกรรมยังคงสร้างสิ่งที่บางคนอธิบายว่าเป็น hacks บน hacks

การอภิปราย context engineering ไม่ว่าจะเรียกชื่ออะไร เน้นความท้าทายที่สำคัญที่ AI development กำลังเผชิญ: วิธีการทำระบบที่สามารถรักษาพฤติกรรมที่สอดคล้องและมีประโยชน์ตลอดการโต้ตอบที่ยาวนานโดยไม่สูญเสียข้อมูลสำคัญหรือเกิดข้อผิดพลาด

อ้างอิง: Context Engineering for Agents