ANTML: ภาษาลับของ Anthropic สำหรับการให้เหตุผลของ AI ก่อให้เกิดการถกเถียงในหมู่นักพัฒนา

ทีมชุมชน BigGo
ANTML: ภาษาลับของ Anthropic สำหรับการให้เหตุผลของ AI ก่อให้เกิดการถกเถียงในหมู่นักพัฒนา

ในโลกของปัญญาประดิษฐ์ที่พัฒนาอย่างรวดเร็ว วิธีการที่แบบจำลองภาษาขนาดใหญ่คิดได้กลายมาเป็นหนึ่งในพื้นที่วิจัยและพัฒนาที่น่าสนใจที่สุด การอภิปรายล่าสุดในหมู่นักพัฒนาและผู้ที่หลงใหลใน AI ต่างมุ่งเน้นไปที่ ANTML (Anthropic Markup Language) ซึ่งเป็นระบบพิเศษที่ใช้ XML เป็นพื้นฐานซึ่ง Anthropic ใช้เพื่อควบคุมกระบวนการให้เหตุผลของ Claude ภาษามาร์กอัปที่ซ่อนอยู่นี้เปิดเผยมากมายเกี่ยวกับวิธีที่ระบบ AI สมัยใหม่จัดโครงสร้างความคิดภายใน ก่อนที่จะส่งคำตอบที่ผ่านการขัดเกลาแล้วให้กับผู้ใช้

ความเป็นจริงทางเทคนิคเบื้องหลัง ANTML

ชุมชนนักพัฒนาได้ระบุอย่างรวดเร็วว่า ANTML ที่จริงแล้วไม่ใช่เทคโนโลยีใหม่ที่ปฏิวัติวงการ แต่เป็นการประยุกต์ใช้มาตรฐาน XML ที่มีอยู่แล้วอย่างเป็นรูปธรรมด้วยเนมสเปซเฉพาะทาง ดังที่ผู้แสดงความคิดเห็นหนึ่งระบุ วิธีการนี้ใช้ประโยชน์จากสิ่งที่เนมสเปซของ XML ถูกออกแบบมาให้ทำพอดี นั่นคือการป้องกันการชนกันของแท็ก ในขณะที่ยังคงรักษาโครงสร้างไว้ แท็กเช่น <thinking> และ <function_calls> ทำหน้าที่เป็นโทเค็นพิเศษที่โมเดลจดจำได้จากการฝึกฝน ทำให้ API ของ Anthropic สามารถแยกการให้เหตุผลภายในของ Claude ออกจากผลลัพธ์สุดท้ายที่ส่งให้ผู้ใช้ได้ การนำไปใช้ทางเทคนิคนี้แสดงให้เห็นว่าบริษัท AI ต่างๆ กำลังสร้างบนมาตรฐานเว็บที่มีอยู่แล้ว แทนที่จะประดิษฐ์ระบบใหม่ทั้งหมดตั้งแต่เริ่มต้น

โทเค็นเหล่านี้เป็นโทเค็นพิเศษที่โมเดลได้รับการฝึกฝนมา และเป็นส่วนหนึ่งของคำศัพท์ของโมเดล รันไทม์ของโมเดลจะจดจำโทเค็นเหล่านี้เป็นโทเค็นพิเศษ

แท็ก ANTML หลักที่ระบุในการอภิปรายของชุมชน:

  • &lt;thinking&gt; / &lt;/thinking&gt; - ครอบคลุมกระบวนการให้เหตุผลของโมเดล
  • &lt;function_calls&gt; - ทำเครื่องหมายการดำเนินการเรียกใช้ฟังก์ชัน
  • พารามิเตอร์การกำหนดค่าเช่น thinking_mode และ max_thinking_length

การปฏิวัติการให้เหตุผลและข้อจำกัดของมัน

สิ่งที่ทำให้ ANTML น่าสนใจเป็นพิเศษสำหรับนักพัฒนาคือวิธีการที่มันเปิดใช้งานการคิดแบบขยายออกไปได้ นั่นคือความสามารถของ Claude ในการทำงานผ่านปัญหาที่ซับซ้อนทีละขั้นตอน ก่อนที่จะให้คำตอบ อย่างไรก็ตาม สมาชิกในชุมชนบางส่วนได้สังเกตเห็นสิ่งที่พวกเขาเรียกว่า เหตุผลบกพร่อง (reasoning mode collapse) ในโมเดลรุ่นใหม่ๆ รุ่นแรกเริ่มของโมเดลให้เหตุผลแสดงร่องรอยการคิดที่ดิบและโปร่งใสมากขึ้น ซึ่งนักพัฒนาพบว่ามีคุณค่าสำหรับการทำความเข้าใจพฤติกรรมของโมเดล เมื่อโมเดลมีวิวัฒนาการ การคิดนี้ได้กลายเป็นเรื่องที่มีโครงสร้างมากขึ้นและควบคุมได้น้อยลงผ่านการปรับแต่งพรอมต์ ชุมชนมองว่านี่เป็นการพัฒนาที่น่าขัน เนื่องจากผู้ให้บริการในเวลาเดียวกันกำลังทำให้การเข้าถึงร่องรอยการให้เหตุผลทำได้ยากขึ้นผ่าน API เพื่อป้องกันไม่ให้นำแบบจำลองไปทำให้บริสุทธิ์

ปัญหาการเรียกใช้เครื่องมือ

ประเด็นสำคัญของการอภิปรายเกี่ยวข้องกับวิธีที่โมเดล AI จัดการกับการเรียกใช้ฟังก์ชันและการใช้งานเครื่องมือ แนวทางปัจจุบันในการใช้แท็กมาร์กอัปพิเศษเช่น <function_calls> ได้กระตุ้นให้เกิดคำถามว่ามีวิธีการที่ดีกว่าหรือไม่ นักพัฒนาบางส่วนสงสัยว่าทำไมผู้ให้บริการโมเดลจึงยังไม่ก้าวข้ามไปกว่าการเพียงแค่สั่งให้โมเดลตอบสนองด้วย JSON พิเศษในพรอมต์ระบบ ทางเลือกอื่นๆ ที่ถูกกล่าวถึงรวมถึงไวยากรณ์ที่ปราศจากบริบท (context-free grammars) และเทคนิคการสุ่มตัวอย่างที่ซับซ้อนมากขึ้น แม้ว่าโดยพื้นฐานแล้วสิ่งเหล่านี้มักยังคงอธิบายโครงสร้าง JSON อยู่ การคงอยู่ของแนวทางที่คล้าย XML ชี้ให้เห็นว่าในขณะที่เทคโนโลยีอาจดูพื้นฐาน แต่มันยังคงมีประสิทธิภาพสำหรับงานที่ซับซ้อนในการจัดโครงสร้างการให้เหตุผลของ AI และการโต้ตอบกับเครื่องมือ

การเปรียบเทียบแนวทางการใช้งาน Reasoning:

  • Anthropic's ANTML: XML namespaces พร้อม special tokens
  • Llama.cpp/vLLM: ย้าย reasoning ไปยังฟิลด์ reasoning_content แยกต่างหาก
  • Context-free grammars: แนวทางทางเลือกที่ยังคงส่งออกเป็น JSON บ่อยครั้ง
  • Raw prompting: คำสั่งพื้นฐานแบบ "think step by step"

มองไปข้างหน้า: อนาคตของการให้เหตุผลของ AI

การอภิปรายที่กำลังดำเนินอยู่เกี่ยวกับ ANTML สะท้อนถึงคำถามที่กว้างขึ้นเกี่ยวกับว่าการให้เหตุผลของ AI ควรจะโปร่งใสเพียงใด และควรมีรูปแบบอย่างไร เมื่อโมเดลมีความสามารถมากขึ้น ความตึงเครียดระหว่างการให้ร่องรอยการให้เหตุผลที่มีประโยชน์กับการปกป้องเทคโนโลยีที่เป็นกรรมสิทธิ์ยังคงเติบโตขึ้น การทดลองของชุมชนด้วยแท็กและพารามิเตอร์การคิด แสดงให้เห็นถึงทั้งความอยากรู้อยากเห็นเกี่ยวกับวิธีการทำงานของระบบเหล่านี้ และความต้องการในทางปฏิบัติสำหรับการแก้จุดบกพร่องและการปรับปรุงแอปพลิเคชัน AI ในขณะที่ ANTML อาจไม่ได้แสดงถึงความก้าวหน้าพื้นฐานในภาษามาร์กอัป แต่มันทำหน้าที่เป็นหน้าต่างสำคัญที่ทำให้มองเห็นว่าบริษัท AI ชั้นนำกำลังจัดการกับความท้าทายในการทำให้การให้เหตุผลของ AI มีทั้งประสิทธิผลและสามารถควบคุมได้

การพัฒนาของ ANTML และระบบที่คล้ายกันหมายถึงขั้นตอนสำคัญในวิวัฒนาการของ AI ซึ่งกระบวนการภายในของแบบจำลองภาษาขนาดใหญ่กำลังกลายเป็นสิ่งที่มีโครงสร้าง จัดการได้ และมองเห็นได้ชัดเจนขึ้นสำหรับนักพัฒนา เมื่อเทคโนโลยีก้าวหน้าต่อไป ความสมดุลระหว่างความโปร่งใส ความสามารถในการใช้งาน และการปกป้องทรัพย์สินทางปัญญาจะยังคงเป็นหัวข้อหลักของการอภิปรายในชุมชนนักพัฒนา AI ต่อไป

อ้างอิง: A Look at ANTML: The Anthropic Markup Language