Microsoft Research ได้เปิดตัว POML (Prompt Orchestration Markup Language) ซึ่งเป็นภาษามาร์กอัปคล้าย XML ที่ออกแบบมาเพื่อจัดโครงสร้างและจัดการพรอมต์สำหรับ Large Language Models อย่างไรก็ตาม การตอบรับของโครงการนี้ได้จุดประกายการอภิปรายอย่างมากในชุมชนเกี่ยวกับแนวทาง ความยั่งยืน และความจำเป็นในภูมิทัศน์ AI ปัจจุบัน
คุณสมบัติหลักของ POML :
- โครงสร้าง markup ที่มีองค์ประกอบเชิงความหมาย (
<role>
,<task>
,<example>
) - การจัดการข้อมูลสำหรับเอกสาร ตาราง และรูปภาพ
- ระบบ styling แบบ CSS สำหรับการแยกส่วนการนำเสนอ
- ระบบ templating ในตัวพร้อมตัวแปร ลูป และเงื่อนไข
- ส่วนขยาย Visual Studio Code ที่มี syntax highlighting และการทดสอบ
- มี SDK สำหรับ Node.js และ Python (ไม่รองรับ C/.NET )
นักพัฒนาคนเดียวเตือนความกังวลเรื่องความยั่งยืน
นักพัฒนาคนเดียวจาก Microsoft Research ได้เปิดเผยความท้าทายที่ไม่คาดคิดที่ POML กำลังเผชิญในอนาคต หลังจากลงทุนเวลาอย่างมากในการสร้างการรวมเข้ากับ Visual Studio Code และเครื่องมือต่างๆ พวกเขาแสดงความสงสัยเกี่ยวกับความเกี่ยวข้องของโครงการในสภาพแวดล้อม AI ที่พัฒนาอย่างรวดเร็วในปัจจุบัน นักพัฒนาระบุว่าโมเดล AI สมัยใหม่มีความไวต่อการจัดรูปแบบพรอมต์น้อยกว่าเวอร์ชันก่อนหน้า และการเขียนโปรแกรมด้วยความช่วยเหลือของ AI สามารถจัดการงานหลายอย่างที่ POML ถูกออกแบบมาเพื่อแก้ไขได้แล้ว
การเปิดเผยว่าโครงการสำคัญของ Microsoft พึ่งพาผู้มีส่วนร่วมเพียงคนเดียวได้ทำให้เกิดคำถามเกี่ยวกับการสนับสนุนจากองค์กรและความยั่งยืนในระยะยาว สิ่งนี้นำไปสู่การอภิปรายในวงกว้างเกี่ยวกับวิธีที่บริษัทเทคโนโลยีขนาดใหญ่สนับสนุนโครงการวิจัยเชิงทดลอง
วิธีการติดตั้ง:
- ส่วนขยาย VS Code: สามารถดาวน์โหลดได้จาก Visual Studio Code Marketplace
- Python:
pip install poml
- Node.js:
npm install poml
(เร็วๆ นี้) - ต้องการการกำหนดค่า: จำเป็นต้องตั้งค่า API key และ endpoint สำหรับการทดสอบ LLM
ชุมชนตั้งคำถามแนวทาง XML
นักพัฒนาในชุมชนได้วิจารณ์การตัดสินใจของ POML ที่สร้างภาษามาร์กอัปใหม่แทนที่จะสร้างบนมาตรฐานที่มีอยู่แล้ว หลายคนชี้ให้เห็นว่า POML ดูเหมือน XML ที่มีฟีเจอร์กำหนดเองแต่ขาดการปฏิบัติตาม XML อย่างเต็มรูปแบบ โดยเฉพาะในการจัดการลูปและตัวแปรเทมเพลตภายในไวยากรณ์วงเล็บ
การสร้างภาษาใหม่ที่ดูเหมือน XML แต่ไม่ใช่ XML นั้น... ค่อนข้างไม่อาจให้อภัยได้ ผมจะไปไกลถึงขนาดเรียกมันว่าเหมือนมือสมัครเล่น
สมาชิกชุมชนหลายคนแนะนำให้ใช้ภาษาการกำหนดค่าที่มีอยู่แล้วเช่น Dhall หรือสร้างไลบรารีเฉพาะโดเมนภายในภาษาโปรแกรมมิ่งที่มีอยู่ คล้ายกับวิธีที่ React ใช้ JSX เป็นตัวห่อหุ้ม JavaScript
ความกังวลเรื่องการแข่งขันและเวลา
การเปิดตัวเกิดขึ้นท่ามกลางเครื่องมือ prompt engineering ที่แออัด GitHub ได้แนะนำรูปแบบ .prompt.yaml แล้ว ในขณะที่บริษัทอื่นๆ เช่น BoundaryML เสนอ BAML ซึ่งเป็นภาษาเฉพาะโดเมนคล้าย TypeScript สำหรับพรอมต์ นักพัฒนาบางคนสังเกตเห็นการประชดที่ Microsoft กำลังแนะนำมาตรฐานอีกตัวหนึ่งเมื่อบริษัทสนับสนุนรูปแบบที่แข่งขันกันอยู่แล้ว
นอกจากนี้ ยังมีคำถามเกี่ยวกับความขัดแย้งด้านทรัพย์สินทางปัญญาที่อาจเกิดขึ้น โดยบางคนชี้ให้เห็นความคล้ายคลึงกับ Prompt Object Model (POM) ของ SignalWire ที่เปิดตัวก่อนหน้านี้ในปี 2025
มาตรฐานที่แข่งขัน:
- GitHub .prompt.yaml: รูปแบบที่ได้รับการสนับสนุนจาก Microsoft สำหรับ GitHub Models
- BAML: DSL แบบ TypeScript โดย BoundaryML
- SignalWire POM: Prompt Object Model ที่เปิดตัวในไตรมาส 1-2 ปี 2025
- เครื่องมือแบบดั้งเดิม: เทมเพลต Jinja, การจัดรูปแบบ Markdown
การสนับสนุน SDK ที่จำกัดส่งสัญญาณปัญหาความเป็นผู้ใหญ่
โครงการปัจจุบันเสนอชุดพัฒนาซอฟต์แวร์เฉพาะ Python และ Node.js เท่านั้น โดยไม่มีการสนับสนุน C#/.NET แม้จะเป็นโครงการของ Microsoft ข้อจำกัดนี้ถูกตีความโดยนักพัฒนาบางคนว่าเป็นสัญญาณของสถานะเชิงทดลองของโครงการและการขาดความพร้อมสำหรับองค์กร
การตอบสนองของชุมชนเน้นย้ำถึงความท้าทายที่ดำเนินต่อไปในพื้นที่เครื่องมือ AI ที่ความก้าวหน้าทางเทคโนโลยีอย่างรวดเร็วมักจะแซงหน้าความพยายามในการกำหนดมาตรฐาน แม้ว่า POML จะแนะนำแนวคิดที่น่าสนใจเช่นการแยกเนื้อหาพรอมต์จากการจัดรูปแบบการนำเสนอ แต่อนาคตของมันยังคงไม่แน่นอนขณะที่นักพัฒนายังคงประเมินตำแหน่งของมันในภูมิทัศน์ AI ที่พัฒนาไป