โปรโตคอล AG-UI เปิดตัวเพื่อสร้างมาตรฐานการปฏิสัมพันธ์ระหว่าง AI Agent กับมนุษย์ในแอปพลิเคชัน

BigGo Editorial Team
โปรโตคอล AG-UI เปิดตัวเพื่อสร้างมาตรฐานการปฏิสัมพันธ์ระหว่าง AI Agent กับมนุษย์ในแอปพลิเคชัน

ระบบนิเวศของ AI agent ได้ก้าวไปอีกขั้นที่สำคัญด้วยการเปิดตัว AG-UI ซึ่งเป็นโปรโตคอลเปิดใหม่ที่ออกแบบมาเพื่อสร้างมาตรฐานวิธีการที่ AI agent มีปฏิสัมพันธ์กับแอปพลิเคชันส่วนหน้า การพัฒนานี้ตอบสนองต่อความต้องการที่เพิ่มขึ้นในชุมชน AI สำหรับวิธีการที่สอดคล้องกันในการเชื่อมต่อระบบ agent ส่วนหลังกับอินเทอร์เฟซที่ผู้ใช้เห็น

การเติมเต็มช่องว่างสำคัญในมาตรฐานการสื่อสารของ Agent

AG-UI วางตำแหน่งตัวเองเป็นโปรโตคอลเสริมสำหรับมาตรฐานที่มีอยู่ในระบบการสื่อสารของ agent ในขณะที่โปรโตคอลอื่นๆ เช่น MCP (Model Completion Protocol) จัดการการสื่อสารระหว่าง agent กับเครื่องมือ และ A2A/ACP จัดการการปฏิสัมพันธ์ระหว่าง agent กับ agent ด้วยกัน AG-UI มุ่งเน้นเฉพาะที่ชั้นอินเทอร์เฟซระหว่าง agent กับมนุษย์ ความแตกต่างนี้มีความสำคัญเนื่องจากตอบสนองต่อสิ่งที่สมาชิกชุมชนคนหนึ่งอธิบายว่าเป็นความต้องการที่มีมานาน:

ผมสงสัยเรื่องนี้มาสักพักแล้ว - ผมเรียกมันว่า MWP - model workload protocol - วิธีการแสดงผลที่เป็นอิสระจากไคลเอนต์เกี่ยวกับสิ่งที่ agent กำลังทำ: ทำงาน, คิด, เรียกใช้เครื่องมือ, พบข้อผิดพลาด, ต้องการข้อมูลจากมนุษย์, ต้องการการอนุมัติจากมนุษย์ ฯลฯ

โปรโตคอลนี้เกิดขึ้นหลังจากการร่วมมือแบบครั้งเดียวเป็นเวลาหนึ่งปีระหว่าง CopilotKit กับเฟรมเวิร์ก agent ต่างๆ ซึ่งในที่สุดนำไปสู่การตัดสินใจสร้างแนวทางที่เป็นมาตรฐานที่สามารถเป็นประโยชน์ต่อระบบนิเวศทั้งหมด

การนำไปใช้ทางเทคนิคและการสนับสนุนเฟรมเวิร์ก

AG-UI ทำงานเป็นโปรโตคอลแบบเบาที่ใช้อีเวนต์เป็นพื้นฐาน โดยมีประเภทอีเวนต์มาตรฐาน 16 ประเภทที่ครอบคลุมการปฏิสัมพันธ์ระหว่าง agent กับผู้ใช้ที่พบบ่อย สถาปัตยกรรมของมันมีความยืดหยุ่นโดยเจตนา ทำงานกับกลไกการส่งอีเวนต์หลากหลายรูปแบบ รวมถึง Server-Sent Events (SSE), WebSockets และ webhooks

โปรโตคอลนี้เปิดตัวพร้อมกับการสนับสนุนทันทีสำหรับเฟรมเวิร์ก agent ยอดนิยมหลายตัว รวมถึง LangGraph, Mastra, CrewAI และ AG2 โดยมีรายงานว่ากำลังพัฒนาความร่วมมือเพิ่มเติม กลยุทธ์การบูรณาการตั้งแต่วันแรกนี้ดูเหมือนจะได้รับการตอบรับที่ดีจากชุมชนนักพัฒนา โดยผู้แสดงความคิดเห็นคนหนึ่งระบุว่ามันจะช่วยแก้ปัญหามากมายสำหรับผู้สร้าง agent

เฟรมเวิร์กที่รองรับ AG-UI

เฟรมเวิร์ก สถานะ
LangGraph รองรับแล้ว
Mastra รองรับแล้ว
CrewAI รองรับแล้ว
AG2 รองรับแล้ว
Agno อยู่ระหว่างดำเนินการ
OpenAI Agent SDK เปิดรับการมีส่วนร่วม
Google ADK เปิดรับการมีส่วนร่วม
Vercel AI SDK เปิดรับการมีส่วนร่วม
AWS Bedrock Agents เปิดรับการมีส่วนร่วม
Cloudflare Agents เปิดรับการมีส่วนร่วม

คุณสมบัติและกรณีการใช้งาน

โปรโตคอลนี้รองรับรูปแบบการปฏิสัมพันธ์หลากหลายที่แอปพลิเคชัน AI สมัยใหม่ต้องการ รวมถึงการแชทแบบ agentic ที่มีการสตรีมแบบเรียลไทม์, การซิงโครไนซ์สถานะแบบสองทิศทาง, UI แบบเจเนอเรทีฟที่มีการสตรีมแบบเดลต้า และเวิร์กโฟลว์การทำงานร่วมกันแบบมีมนุษย์ในลูป

สำหรับนักพัฒนา AG-UI ให้วิธีการมาตรฐานในการนำคุณสมบัติต่างๆ มาใช้ เช่น การแสดงเมื่อ agent กำลังทำงาน, คิด, เรียกใช้เครื่องมือ, พบข้อผิดพลาด หรือต้องการข้อมูลหรือการอนุมัติจากมนุษย์ การสร้างมาตรฐานนี้อาจช่วยลดภาระในการพัฒนาอย่างมีนัยสำคัญสำหรับทีมที่กำลังสร้างแอปพลิเคชันที่ขับเคลื่อนด้วย AI

ทีม AG-UI ยังได้สร้างทรัพยากรสาธิตรวมถึงแอป hello-world และ AG-UI Dojo - ชุดแสดงบล็อกการสร้างที่ออกแบบให้เรียบง่ายและมีจุดเน้น โดยทั่วไปมีโค้ดระหว่าง 50-200 บรรทัด

คุณสมบัติหลักของ AG-UI

  • การแชทแบบอัจฉริยะพร้อมการสตรีมแบบเรียลไทม์
  • การซิงค์สถานะแบบสองทิศทาง (ทั้งเข้าและออกจากการแชท)
  • UI แบบเจนเนอเรทีฟและข้อความแบบมีโครงสร้างพร้อมการสตรีมแบบเดลต้า
  • การเพิ่มบริบทแบบเรียลไทม์
  • การใช้เครื่องมือฝั่งฟรอนต์เอนด์ (การเรียกใช้เครื่องมือ)
  • การทำงานร่วมกันแบบมนุษย์ในวงจรและมนุษย์บนวงจร

การตอบรับจากชุมชนและทิศทางในอนาคต

การตอบรับเริ่มต้นต่อ AG-UI ดูเป็นไปในทางบวก โดยสมาชิกในชุมชนแสดงความตื่นเต้นเกี่ยวกับการทดลองใช้โปรโตคอลและการมีส่วนร่วมในการพัฒนา ทีม AG-UI ได้กำหนดการประชุมกลุ่มทำงานเพื่อช่วยขยายและกำหนดทิศทางของโปรโตคอล ซึ่งแสดงถึงความมุ่งมั่นในการพัฒนาที่ขับเคลื่อนโดยชุมชน

เมื่อ AI agent กลายเป็นสิ่งที่แพร่หลายมากขึ้นในแอปพลิเคชันต่างๆ บนแพลตฟอร์มที่หลากหลาย ความพยายามในการสร้างมาตรฐานเช่น AG-UI อาจพิสูจน์ได้ว่ามีความสำคัญในการสร้างรูปแบบประสบการณ์ผู้ใช้ที่สอดคล้องกันและเร่งวงจรการพัฒนา การมุ่งเน้นของโปรโตคอลในการปฏิสัมพันธ์ระหว่างมนุษย์กับ agent ตอบสนองต่อความต้องการเฉพาะที่น่าจะเติบโตขึ้นเมื่อความสามารถของ AI ยังคงก้าวหน้าและบูรณาการลึกลงไปในแอปพลิเคชันที่ใช้ในชีวิตประจำวันมากขึ้น

อ้างอิง: AG-UI: The Agent-User Interaction Protocol