POML ของ Microsoft ถูกวิจารณ์จากชุมชนขณะที่นักพัฒนาคนเดียวเปิดเผยความท้าทายของโครงการ

ทีมชุมชน BigGo
POML ของ Microsoft ถูกวิจารณ์จากชุมชนขณะที่นักพัฒนาคนเดียวเปิดเผยความท้าทายของโครงการ

Microsoft Research ได้เปิดตัว POML (Prompt Orchestration Markup Language) ซึ่งเป็นภาษามาร์กอัปคล้าย XML ที่ออกแบบมาเพื่อจัดโครงสร้างและจัดการพรอมต์สำหรับ Large Language Models อย่างไรก็ตาม การตอบรับของโครงการนี้ได้จุดประกายการอภิปรายอย่างมากในชุมชนเกี่ยวกับแนวทาง ความยั่งยืน และความจำเป็นในภูมิทัศน์ AI ปัจจุบัน

คุณสมบัติหลักของ POML :

  • โครงสร้าง markup ที่มีองค์ประกอบเชิงความหมาย (<role>, <task>, <example>)
  • การจัดการข้อมูลสำหรับเอกสาร ตาราง และรูปภาพ
  • ระบบ styling แบบ CSS สำหรับการแยกส่วนการนำเสนอ
  • ระบบ templating ในตัวพร้อมตัวแปร ลูป และเงื่อนไข
  • ส่วนขยาย Visual Studio Code ที่มี syntax highlighting และการทดสอบ
  • มี SDK สำหรับ Node.js และ Python (ไม่รองรับ C/.NET )

นักพัฒนาคนเดียวเตือนความกังวลเรื่องความยั่งยืน

นักพัฒนาคนเดียวจาก Microsoft Research ได้เปิดเผยความท้าทายที่ไม่คาดคิดที่ POML กำลังเผชิญในอนาคต หลังจากลงทุนเวลาอย่างมากในการสร้างการรวมเข้ากับ Visual Studio Code และเครื่องมือต่างๆ พวกเขาแสดงความสงสัยเกี่ยวกับความเกี่ยวข้องของโครงการในสภาพแวดล้อม AI ที่พัฒนาอย่างรวดเร็วในปัจจุบัน นักพัฒนาระบุว่าโมเดล AI สมัยใหม่มีความไวต่อการจัดรูปแบบพรอมต์น้อยกว่าเวอร์ชันก่อนหน้า และการเขียนโปรแกรมด้วยความช่วยเหลือของ AI สามารถจัดการงานหลายอย่างที่ POML ถูกออกแบบมาเพื่อแก้ไขได้แล้ว

การเปิดเผยว่าโครงการสำคัญของ Microsoft พึ่งพาผู้มีส่วนร่วมเพียงคนเดียวได้ทำให้เกิดคำถามเกี่ยวกับการสนับสนุนจากองค์กรและความยั่งยืนในระยะยาว สิ่งนี้นำไปสู่การอภิปรายในวงกว้างเกี่ยวกับวิธีที่บริษัทเทคโนโลยีขนาดใหญ่สนับสนุนโครงการวิจัยเชิงทดลอง

วิธีการติดตั้ง:

  • ส่วนขยาย VS Code: สามารถดาวน์โหลดได้จาก Visual Studio Code Marketplace
  • Python: pip install poml
  • Node.js: npm install poml (เร็วๆ นี้)
  • ต้องการการกำหนดค่า: จำเป็นต้องตั้งค่า API key และ endpoint สำหรับการทดสอบ LLM

ชุมชนตั้งคำถามแนวทาง XML

นักพัฒนาในชุมชนได้วิจารณ์การตัดสินใจของ POML ที่สร้างภาษามาร์กอัปใหม่แทนที่จะสร้างบนมาตรฐานที่มีอยู่แล้ว หลายคนชี้ให้เห็นว่า POML ดูเหมือน XML ที่มีฟีเจอร์กำหนดเองแต่ขาดการปฏิบัติตาม XML อย่างเต็มรูปแบบ โดยเฉพาะในการจัดการลูปและตัวแปรเทมเพลตภายในไวยากรณ์วงเล็บ

การสร้างภาษาใหม่ที่ดูเหมือน XML แต่ไม่ใช่ XML นั้น... ค่อนข้างไม่อาจให้อภัยได้ ผมจะไปไกลถึงขนาดเรียกมันว่าเหมือนมือสมัครเล่น

สมาชิกชุมชนหลายคนแนะนำให้ใช้ภาษาการกำหนดค่าที่มีอยู่แล้วเช่น Dhall หรือสร้างไลบรารีเฉพาะโดเมนภายในภาษาโปรแกรมมิ่งที่มีอยู่ คล้ายกับวิธีที่ React ใช้ JSX เป็นตัวห่อหุ้ม JavaScript

ความกังวลเรื่องการแข่งขันและเวลา

การเปิดตัวเกิดขึ้นท่ามกลางเครื่องมือ prompt engineering ที่แออัด GitHub ได้แนะนำรูปแบบ .prompt.yaml แล้ว ในขณะที่บริษัทอื่นๆ เช่น BoundaryML เสนอ BAML ซึ่งเป็นภาษาเฉพาะโดเมนคล้าย TypeScript สำหรับพรอมต์ นักพัฒนาบางคนสังเกตเห็นการประชดที่ Microsoft กำลังแนะนำมาตรฐานอีกตัวหนึ่งเมื่อบริษัทสนับสนุนรูปแบบที่แข่งขันกันอยู่แล้ว

นอกจากนี้ ยังมีคำถามเกี่ยวกับความขัดแย้งด้านทรัพย์สินทางปัญญาที่อาจเกิดขึ้น โดยบางคนชี้ให้เห็นความคล้ายคลึงกับ Prompt Object Model (POM) ของ SignalWire ที่เปิดตัวก่อนหน้านี้ในปี 2025

มาตรฐานที่แข่งขัน:

  • GitHub .prompt.yaml: รูปแบบที่ได้รับการสนับสนุนจาก Microsoft สำหรับ GitHub Models
  • BAML: DSL แบบ TypeScript โดย BoundaryML
  • SignalWire POM: Prompt Object Model ที่เปิดตัวในไตรมาส 1-2 ปี 2025
  • เครื่องมือแบบดั้งเดิม: เทมเพลต Jinja, การจัดรูปแบบ Markdown

การสนับสนุน SDK ที่จำกัดส่งสัญญาณปัญหาความเป็นผู้ใหญ่

โครงการปัจจุบันเสนอชุดพัฒนาซอฟต์แวร์เฉพาะ Python และ Node.js เท่านั้น โดยไม่มีการสนับสนุน C#/.NET แม้จะเป็นโครงการของ Microsoft ข้อจำกัดนี้ถูกตีความโดยนักพัฒนาบางคนว่าเป็นสัญญาณของสถานะเชิงทดลองของโครงการและการขาดความพร้อมสำหรับองค์กร

การตอบสนองของชุมชนเน้นย้ำถึงความท้าทายที่ดำเนินต่อไปในพื้นที่เครื่องมือ AI ที่ความก้าวหน้าทางเทคโนโลยีอย่างรวดเร็วมักจะแซงหน้าความพยายามในการกำหนดมาตรฐาน แม้ว่า POML จะแนะนำแนวคิดที่น่าสนใจเช่นการแยกเนื้อหาพรอมต์จากการจัดรูปแบบการนำเสนอ แต่อนาคตของมันยังคงไม่แน่นอนขณะที่นักพัฒนายังคงประเมินตำแหน่งของมันในภูมิทัศน์ AI ที่พัฒนาไป

อ้างอิง: POML: Prompt Orchestration Markup Language