Rowboat ใช้แนวทางภาษาธรรมชาติในการสร้าง AI Agent จุดประกายการถ่ายเถียงเรื่องการออกแบบแบบผังงานกับการสนทนา

ทีมชุมชน BigGo
Rowboat ใช้แนวทางภาษาธรรมชาติในการสร้าง AI Agent จุดประกายการถ่ายเถียงเรื่องการออกแบบแบบผังงานกับการสนทนา

Rowboat สตาร์ทอัพจาก Y Combinator S24 ได้เปิดตัวแพลตฟอร์มโอเพนซอร์สที่ให้ผู้ใช้สร้างเวิร์กโฟลว์ AI agent ผ่านการสนทนาด้วยภาษาธรรมชาติแทนที่จะใช้อินเทอร์เฟซแบบผังงานแบบดั้งเดิม แนวทางนี้ได้จุดประกายการอภิปรายอย่างมีนัยสำคัญในชุมชนนักพัฒนาเกี่ยวกับอนาคตของเครื่องมือระบบอัตโนมัติ agent

แพลตฟอร์มนี้ช่วยให้ผู้ใช้สามารถอธิบายความต้องการในการทำงานอัตโนมัติด้วยภาษาอังกฤษธรรมดาให้กับ AI copilot ซึ่งจะสร้างเวิร์กโฟลว์แบบ multi-agent โดยอัตโนมัติ ผู้ใช้สามารถรวมเครื่องมือต่างๆ เพิ่มเอกสารสำหรับ retrieval-augmented generation (RAG) ตั้งค่าตัวกระตุ้น และปรับใช้ agent ผ่าน API หรือ SDK ทั้งหมดนี้โดยไม่ต้องวาดไดอะแกรมเวิร์กโฟลว์ด้วยตนเอง

คุณสมบัติหลัก

  • การสร้างเอเจนต์ภาษาธรรมชาติผ่าน AI copilot
  • การรวมเครื่องมือด้วยการคลิกเพียงครั้งเดียว
  • การสนับสนุน RAG ในตัวสำหรับการอัปโหลดเอกสารและการดึงข้อมูลจาก URL
  • ตัวกระตุ้นตามเวลาและระบบอัตโนมัติของเหตุการณ์
  • API และ SDK สำหรับการรวมระบบแบบกำหนดเอง
  • ตัวเลือกการปรับใช้แบบ Self-hosted ( Docker ) และ cloud

ข้อกังวลเรื่องความไว้วางใจและการควบคุมท้าทายแนวทางภาษาธรรมชาติ

การเปลี่ยนจากเครื่องมือสร้างเวิร์กโฟลว์แบบภาพได้ทำให้เกิดคำถามสำคัญเกี่ยวกับความน่าเชื่อถือของระบบและการกำกับดูแล สมาชิกในชุมชนได้เน้นย้ำว่าเครื่องมือสร้างแบบผังงานมีข้อได้เปรียบที่ชัดเจนในการสร้างความไว้วางใจ ช่วยให้นักพัฒนาสามารถแทรกขั้นตอนการอนุมัติจากมนุษย์และมั่นใจว่าการกระทำที่สำคัญจะดำเนินการภายใต้เงื่อนไขที่เฉพาะเจาะจง การมองเห็นนี้ทำให้ง่ายต่อการตรวจสอบและยืนยันพฤติกรรมของระบบก่อนการปรับใช้

ทีม Rowboat ยอมรับข้อแลกเปลี่ยนนี้ โดยแนะนำว่าความไว้วางใจในระบบ agent ต้องสร้างขึ้นผ่านการทดสอบเชิงประจักษ์มากกว่าการตรวจสอบด้วยภาพ พวกเขาเสนอให้เริ่มต้นด้วยการทดสอบด้วยตนเองและขยายขึ้นด้วยการจำลองแบบ AI เพื่อครอบคลุมสถานการณ์ต่างๆ มากขึ้น ขณะเดียวกันใช้ agent เฉพาะทางหลายตัวเพื่อแยกและทดสอบส่วนประกอบต่างๆ แยกกัน

การประยุกต์ใช้งานจริงแสดงให้เห็นศักยภาพแม้จะมีความท้าทายในการรวมระบบ

ผู้ใช้รุ่นแรกได้ทดสอบ Rowboat สำหรับงานอัตโนมัติต่างๆ รวมถึงการติดตามข่าวสารและเวิร์กโฟลว์การโพสต์โซเชียลมีเดีย อย่างไรก็ตาม บางคนได้พบปัญหาทางเทคนิคกับการรวมระบบบุคคลที่สาม โดยเฉพาะกับบริการอย่าง Instagram ผ่าน Composio connectors ซึ่งนำไปสู่ข้อผิดพลาด 400 และการหยุดชะงักของเวิร์กโฟลว์

แพลตฟอร์มนี้มีความสามารถในตัวหลายอย่าง รวมถึงการค้นหาเว็บ การเรียกดู Reddit และตัวกระตุ้นตามเวลา Rowboat มีทั้งเวอร์ชันที่โฮสต์เองและคลาวด์ โดยราคาเริ่มต้นที่ 20 ดอลลาร์สหรัฐสำหรับแผนพื้นฐานและขยายไปถึง 200 ดอลลาร์สหรัฐสำหรับการใช้งานแบบมืออาชีพ พร้อมตัวเลือกแบบจ่ายตามการใช้งานที่วางแผนไว้

โครงสร้างราคา

  • แผน Starter: $20 USD
  • แผน Pro: $200 USD
  • ระบบชำระเงินตามการใช้งาน: เร็วๆ นี้

การวางตำแหน่งการแข่งขันเทียบกับเครื่องมือเวิร์กโฟลว์ที่มีอยู่

เมื่อเปรียบเทียบกับแพลตฟอร์มที่มีอยู่แล้วอย่าง n8n และ Relevance AI Rowboat เน้นย้ำการมุ่งเน้นไปที่รูปแบบ agentic มากกว่าการเชื่อมต่อ API แบบเส้นตรง ทีมงานโต้แย้งว่าสถานการณ์การตัดสินใจที่ซับซ้อนและไม่เป็นเส้นตรงจะกลายเป็นเรื่องยุ่งยากในรูปแบบผังงาน โดยเฉพาะสำหรับการสนับสนุนลูกค้าหรือกรณีการใช้งานที่มีปฏิสัมพันธ์กับมนุษย์อื่นๆ

เราเชื่อมั่นอย่างยิ่งว่าเครื่องมือสร้างแบบผังงานจะไปถึงขีดจำกัดอย่างรวดเร็วในประเภทของผู้ช่วยที่คุณสามารถสร้างได้ และสิ่งนี้เกี่ยวข้องกับความจริงที่ว่างานในโลกจริงหลายอย่างไม่มีขั้นตอนที่กำหนดไว้อย่างชัดเจน

แพลตฟอร์มใช้ agent SDK ของ OpenAI กับ agent สามประเภท: conversational agents ที่โต้ตอบกับผู้ใช้ task agents สำหรับการประมวลผลภายใน และ pipeline agents สำหรับการดำเนินการตามลำดับ สถาปัตยกรรมนี้มีจุดมุ่งหมายเพื่อจัดการกับสถานการณ์ที่ซับซ้อนซึ่งจะต้องใช้ jump logic อย่างกว้างขวางในระบบผังงานแบบดั้งเดิม

ประเภทของ Agent ใน Rowboat

  • Conversational agents: สามารถสนทนากับผู้ใช้ เรียกใช้เครื่องมือ และส่งต่องานให้กับ agent อื่นๆ ได้
  • Task agents: Agent ภายในที่สามารถเรียกใช้เครื่องมือได้ แต่ไม่สามารถโต้ตอบกับผู้ใช้ได้
  • Pipeline agents: ลำดับการทำงานแบบต่อเนื่องของ task agent ที่มีการควบคุมการไหลของงานแบบกำหนดไว้ล่วงหน้า

มองไปข้างหน้า

Rowboat แสดงถึงการเดิมพันที่สำคัญในวิวัฒนาการของความสามารถ AI โดยสมมติว่าการปรับปรุงโมเดลภาษาจะทำให้การกำหนดเวิร์กโฟลว์อย่างชัดเจนไม่จำเป็น ว่าแนวทางภาษาธรรมชาตินี้จะสามารถส่งมอบความน่าเชื่อถือและความโปร่งใสที่ผู้ใช้องค์กรต้องการหรือไม่ยังคงต้องติดตามดู แต่การมีส่วนร่วมของชุมชนในช่วงแรกแสดงให้เห็นความสนใจอย่างมากในทางเลือกอื่นสำหรับเครื่องมือระบบอัตโนมัติแบบดั้งเดิม

RAG (Retrieval-Augmented Generation): เทคนิคที่ปรับปรุงการตอบสนองของ AI โดยการรวมข้อมูลที่เกี่ยวข้องจากเอกสารหรือฐานข้อมูลภายนอก

อ้างอิง: rowboat