ระบบนิเวศของ AI agent ได้ก้าวไปอีกขั้นที่สำคัญด้วยการเปิดตัว AG-UI ซึ่งเป็นโปรโตคอลเปิดใหม่ที่ออกแบบมาเพื่อสร้างมาตรฐานวิธีการที่ AI agent มีปฏิสัมพันธ์กับแอปพลิเคชันส่วนหน้า การพัฒนานี้ตอบสนองต่อความต้องการที่เพิ่มขึ้นในชุมชน AI สำหรับวิธีการที่สอดคล้องกันในการเชื่อมต่อระบบ agent ส่วนหลังกับอินเทอร์เฟซที่ผู้ใช้เห็น
การเติมเต็มช่องว่างสำคัญในมาตรฐานการสื่อสารของ Agent
AG-UI วางตำแหน่งตัวเองเป็นโปรโตคอลเสริมสำหรับมาตรฐานที่มีอยู่ในระบบการสื่อสารของ agent ในขณะที่โปรโตคอลอื่นๆ เช่น MCP (Model Completion Protocol) จัดการการสื่อสารระหว่าง agent กับเครื่องมือ และ A2A/ACP จัดการการปฏิสัมพันธ์ระหว่าง agent กับ agent ด้วยกัน AG-UI มุ่งเน้นเฉพาะที่ชั้นอินเทอร์เฟซระหว่าง agent กับมนุษย์ ความแตกต่างนี้มีความสำคัญเนื่องจากตอบสนองต่อสิ่งที่สมาชิกชุมชนคนหนึ่งอธิบายว่าเป็นความต้องการที่มีมานาน:
ผมสงสัยเรื่องนี้มาสักพักแล้ว - ผมเรียกมันว่า MWP - model workload protocol - วิธีการแสดงผลที่เป็นอิสระจากไคลเอนต์เกี่ยวกับสิ่งที่ agent กำลังทำ: ทำงาน, คิด, เรียกใช้เครื่องมือ, พบข้อผิดพลาด, ต้องการข้อมูลจากมนุษย์, ต้องการการอนุมัติจากมนุษย์ ฯลฯ
โปรโตคอลนี้เกิดขึ้นหลังจากการร่วมมือแบบครั้งเดียวเป็นเวลาหนึ่งปีระหว่าง CopilotKit กับเฟรมเวิร์ก agent ต่างๆ ซึ่งในที่สุดนำไปสู่การตัดสินใจสร้างแนวทางที่เป็นมาตรฐานที่สามารถเป็นประโยชน์ต่อระบบนิเวศทั้งหมด
การนำไปใช้ทางเทคนิคและการสนับสนุนเฟรมเวิร์ก
AG-UI ทำงานเป็นโปรโตคอลแบบเบาที่ใช้อีเวนต์เป็นพื้นฐาน โดยมีประเภทอีเวนต์มาตรฐาน 16 ประเภทที่ครอบคลุมการปฏิสัมพันธ์ระหว่าง agent กับผู้ใช้ที่พบบ่อย สถาปัตยกรรมของมันมีความยืดหยุ่นโดยเจตนา ทำงานกับกลไกการส่งอีเวนต์หลากหลายรูปแบบ รวมถึง Server-Sent Events (SSE), WebSockets และ webhooks
โปรโตคอลนี้เปิดตัวพร้อมกับการสนับสนุนทันทีสำหรับเฟรมเวิร์ก agent ยอดนิยมหลายตัว รวมถึง LangGraph, Mastra, CrewAI และ AG2 โดยมีรายงานว่ากำลังพัฒนาความร่วมมือเพิ่มเติม กลยุทธ์การบูรณาการตั้งแต่วันแรกนี้ดูเหมือนจะได้รับการตอบรับที่ดีจากชุมชนนักพัฒนา โดยผู้แสดงความคิดเห็นคนหนึ่งระบุว่ามันจะช่วยแก้ปัญหามากมายสำหรับผู้สร้าง agent
เฟรมเวิร์กที่รองรับ AG-UI
เฟรมเวิร์ก | สถานะ |
---|---|
LangGraph | รองรับแล้ว |
Mastra | รองรับแล้ว |
CrewAI | รองรับแล้ว |
AG2 | รองรับแล้ว |
Agno | อยู่ระหว่างดำเนินการ |
OpenAI Agent SDK | เปิดรับการมีส่วนร่วม |
Google ADK | เปิดรับการมีส่วนร่วม |
Vercel AI SDK | เปิดรับการมีส่วนร่วม |
AWS Bedrock Agents | เปิดรับการมีส่วนร่วม |
Cloudflare Agents | เปิดรับการมีส่วนร่วม |
คุณสมบัติและกรณีการใช้งาน
โปรโตคอลนี้รองรับรูปแบบการปฏิสัมพันธ์หลากหลายที่แอปพลิเคชัน AI สมัยใหม่ต้องการ รวมถึงการแชทแบบ agentic ที่มีการสตรีมแบบเรียลไทม์, การซิงโครไนซ์สถานะแบบสองทิศทาง, UI แบบเจเนอเรทีฟที่มีการสตรีมแบบเดลต้า และเวิร์กโฟลว์การทำงานร่วมกันแบบมีมนุษย์ในลูป
สำหรับนักพัฒนา AG-UI ให้วิธีการมาตรฐานในการนำคุณสมบัติต่างๆ มาใช้ เช่น การแสดงเมื่อ agent กำลังทำงาน, คิด, เรียกใช้เครื่องมือ, พบข้อผิดพลาด หรือต้องการข้อมูลหรือการอนุมัติจากมนุษย์ การสร้างมาตรฐานนี้อาจช่วยลดภาระในการพัฒนาอย่างมีนัยสำคัญสำหรับทีมที่กำลังสร้างแอปพลิเคชันที่ขับเคลื่อนด้วย AI
ทีม AG-UI ยังได้สร้างทรัพยากรสาธิตรวมถึงแอป hello-world และ AG-UI Dojo - ชุดแสดงบล็อกการสร้างที่ออกแบบให้เรียบง่ายและมีจุดเน้น โดยทั่วไปมีโค้ดระหว่าง 50-200 บรรทัด
คุณสมบัติหลักของ AG-UI
- การแชทแบบอัจฉริยะพร้อมการสตรีมแบบเรียลไทม์
- การซิงค์สถานะแบบสองทิศทาง (ทั้งเข้าและออกจากการแชท)
- UI แบบเจนเนอเรทีฟและข้อความแบบมีโครงสร้างพร้อมการสตรีมแบบเดลต้า
- การเพิ่มบริบทแบบเรียลไทม์
- การใช้เครื่องมือฝั่งฟรอนต์เอนด์ (การเรียกใช้เครื่องมือ)
- การทำงานร่วมกันแบบมนุษย์ในวงจรและมนุษย์บนวงจร
การตอบรับจากชุมชนและทิศทางในอนาคต
การตอบรับเริ่มต้นต่อ AG-UI ดูเป็นไปในทางบวก โดยสมาชิกในชุมชนแสดงความตื่นเต้นเกี่ยวกับการทดลองใช้โปรโตคอลและการมีส่วนร่วมในการพัฒนา ทีม AG-UI ได้กำหนดการประชุมกลุ่มทำงานเพื่อช่วยขยายและกำหนดทิศทางของโปรโตคอล ซึ่งแสดงถึงความมุ่งมั่นในการพัฒนาที่ขับเคลื่อนโดยชุมชน
เมื่อ AI agent กลายเป็นสิ่งที่แพร่หลายมากขึ้นในแอปพลิเคชันต่างๆ บนแพลตฟอร์มที่หลากหลาย ความพยายามในการสร้างมาตรฐานเช่น AG-UI อาจพิสูจน์ได้ว่ามีความสำคัญในการสร้างรูปแบบประสบการณ์ผู้ใช้ที่สอดคล้องกันและเร่งวงจรการพัฒนา การมุ่งเน้นของโปรโตคอลในการปฏิสัมพันธ์ระหว่างมนุษย์กับ agent ตอบสนองต่อความต้องการเฉพาะที่น่าจะเติบโตขึ้นเมื่อความสามารถของ AI ยังคงก้าวหน้าและบูรณาการลึกลงไปในแอปพลิเคชันที่ใช้ในชีวิตประจำวันมากขึ้น