Microsoft เปิดตัว POML (Prompt Orchestration Markup Language)

Microsoft เปิดตัว Prompt Orchestration Markup Language (POML) เฟรมเวิร์กโอเพนซอร์สใหม่ที่ช่วยให้นักพัฒนาสร้าง AI prompt ที่ซับซ้อนได้ง่ายขึ้น พร้อมฟีเจอร์การจัดการข้อมูล การสร้างเทมเพลต และเครื่องมือสำหรับนักพัฒนา

Microsoft เปิดตัว POML (Prompt Orchestration Markup Language)

Key takeaway

  • POML เป็นภาษามาร์กอัปตัวใหม่จาก Microsoft ที่ช่วยให้การเขียน Prompt สำหรับ LLM มีโครงสร้างที่เป็นระเบียบ สามารถนำกลับมาใช้ใหม่ได้ และขยายความสามารถได้ง่าย โดยใช้รูปแบบคล้าย HTML/XML
  • POML มีคุณสมบัติหลักที่โดดเด่นคือ การจัดการโครงสร้าง Prompt ด้วย Element ต่างๆ เช่น,, รองรับการใช้งานข้อมูลหลากหลายรูปแบบ และมีระบบ Stylesheet แยกการจัดรูปแบบออกจากเนื้อหา
  • มีเครื่องมือสนับสนุนการพัฒนาที่ครบครัน ทั้ง VS Code Extension, SDK สำหรับ Node.js และ Python รวมถึงระบบ Template ที่ช่วยให้สร้าง Prompt แบบไดนามิกได้ ทำให้นักพัฒนาสามารถจัดการ Prompt ที่ซับซ้อนได้อย่างมีประสิทธิภาพ

การออกแบบ Prompt กลายเป็นรากฐานสำคัญในการพัฒนาแอปพลิเคชันขั้นสูงที่ขับเคลื่อนด้วย Large Language Models (LLMs) แล้ว เมื่อ prompt มีความซับซ้อนมากขึ้น ทั้งองค์ประกอบแบบไดนามิก บทบาทหลากหลาย ข้อมูลแบบมีโครงสร้าง และรูปแบบเอาต์พุตที่หลากหลาย ข้อจำกัดของการใช้ข้อความแบบไม่มีโครงสร้างก็เริ่มปรากฏชัดเจน Microsoft จึงได้เปิดตัว Prompt Orchestration Markup Language (POML) เฟรมเวิร์กโอเพนซอร์สใหม่ที่ออกแบบมาเพื่อสร้างระเบียบ ความเป็นโมดูลาร์ และความสามารถในการขยายให้กับการออกแบบ prompt สำหรับ LLMs

POML คืออะไร?

POML เป็นภาษามาร์กอัปที่ได้แรงบันดาลใจจาก HTML/XML ออกแบบมาเพื่อสร้าง AI prompt ที่ซับซ้อน บำรุงรักษาได้ และนำกลับมาใช้ใหม่ได้ โดยมีวิธีการเป็นระบบสำหรับ:

  • กำหนดโครงสร้าง prompt โดยใช้คอมโพเนนต์เชิงความหมายและบทบาท
  • ผสานรวมประเภทข้อมูลที่หลากหลายและทรัพยากรภายนอก
  • แยกเนื้อหาออกจากการนำเสนอด้วย stylesheet
  • เปิดใช้งานเทมเพลตขั้นสูงและตรรกะตัวแปรสำหรับการสร้าง prompt แบบไดนามิก
  • สนับสนุนนักพัฒนาด้วยระบบนิเวศของเครื่องมือที่แข็งแกร่ง

คุณสมบัติหลัก

1. โครงสร้าง Prompt Markup

POML ใช้องค์ประกอบที่ชัดเจนเชิงความหมาย เช่น <role>, <task> และ <example> เพื่อกำหนดส่วนต่างๆ ทางตรรกะของ prompt การออกแบบแบบโมดูลาร์นี้ทำให้ prompt อ่านง่าย บำรุงรักษาได้ และนำกลับมาใช้ใหม่ได้สูง

<poml>
  <role>You are a science teacher.</role>
  <task>Explain gravity using the image below.</task>
  <img src="gravity_diagram.png" alt="Diagram of gravity" />
  <output-format>
    Use simple language and keep your answer under 50 words.
  </output-format>
</poml>

วิธีการนี้ช่วยกำจัดปัญหาการจัดรูปแบบที่เปราะบางที่มักพบใน "prompt spaghetti" และส่งเสริมการแยกความรับผิดชอบอย่างชัดเจน

2. การจัดการข้อมูลแบบครอบคลุม

POML รองรับการฝังหรืออ้างอิงข้อมูลภายนอกประเภทต่างๆ:

  • เอกสารข้อความ (<document>)
  • สเปรดชีตและตาราง (<table>)
  • รูปภาพ (<img>)
  • รูปแบบอื่นๆ ตามความจำเป็น

ทำให้สามารถผสานรวมเอกสารอ้างอิง ชุดข้อมูลการสอน และสื่อภาพได้อย่างราบรื่นภายใน prompt

3. การแยกรูปแบบการนำเสนอ

ได้รับแรงบันดาลใจจาก CSS, POML สนับสนุนระบบสไตล์ที่แยกเนื้อหาออกจากการจัดรูปแบบและข้อจำกัดของเอาต์พุต สไตล์สามารถระบุใน <stylesheet> หรือด้วยแอตทริบิวต์แบบอินไลน์ ทำให้สามารถปรับเปลี่ยนได้ง่ายโดยไม่ต้องแตะโครงสร้างทางตรรกะของ prompt

4. เครื่องมือสร้างเทมเพลตแบบบูรณาการ

POML รวมเครื่องมือสร้างเทมเพลตที่ทรงพลังซึ่งสนับสนุน:

  • ตัวแปรและการแทนที่
  • เงื่อนไขและลูป
  • การรวมโมดูลและการนำกลับมาใช้ใหม่

ระบบไดนามิกนี้ช่วยให้นักพัฒนาสามารถสร้าง prompt แบบโปรแกรมและจัดการกับรูปแบบที่ซับซ้อนในระดับใหญ่

5. ระบบนิเวศของเครื่องมือที่หลากหลาย

ภาษานี้มีชุดเครื่องมือสำหรับนักพัฒนา:

  • VS Code Extension: ให้การไฮไลต์ไวยากรณ์ การเติมอัตโนมัติ เอกสารเมื่อวางเมาส์ การวินิจฉัย และการพรีวิวสดของการจัดรูปแบบและตรรกะของ prompt
  • SDKs: POML มีไลบรารีสำหรับ Node.js (TypeScript/JavaScript) และ Python ช่วยให้ผสานรวมกับเวิร์กโฟลว์ที่มีอยู่และเฟรมเวิร์ก LLM ยอดนิยมได้ง่าย

การกำหนดค่ากับผู้ให้บริการ LLM ที่คุณต้องการ (เช่น OpenAI, Azure) ก็ทำได้อย่างตรงไปตรงมา ช่วยให้ทดสอบและปรับใช้ได้อย่างรวดเร็ว

สถาปัตยกรรมทางเทคนิคและปรัชญา

POML ถูกออกแบบให้เป็น "view layer" เหมือนกับที่พบในการพัฒนาฟรอนต์เอนด์แบบดั้งเดิม (สถาปัตยกรรม MVC) มาร์กอัปกำหนดการนำเสนอ ไม่ใช่ตรรกะทางธุรกิจหรือการเข้าถึงข้อมูล ช่วยให้แยกส่วนได้อย่างชัดเจนและทำให้ง่ายต่อการปรับโครงสร้าง prompt, ทดสอบรูปแบบต่างๆ และรับประกันความสอดคล้องกันในเวิร์กโฟลว์ของเอเจนต์และการทดสอบอัตโนมัติ

การติดตั้งและเริ่มต้น

POML เป็นโอเพนซอร์ส (MIT License) และมีให้บน GitHub คุณสามารถ:

  • ติดตั้ง VS Code extension จาก marketplace
  • ใช้ Node.js (npm install pomljs) หรือ Python (pip install poml) SDKs
  • อ้างอิงเอกสาร POML โดยละเอียดสำหรับไวยากรณ์ ตัวอย่าง และคู่มือการผสานรวม

Prompt Orchestration Markup Language (POML) นำโครงสร้าง ความสามารถในการขยาย และความสามารถในการบำรุงรักษาที่จำเป็นอย่างมากมาสู่การออกแบบ prompt สำหรับนักพัฒนา AI ไวยากรณ์แบบโมดูลาร์ การจัดการข้อมูลแบบครอบคลุม การแยกสไตล์ การสร้างเทมเพลตแบบไดนามิก และระบบนิเวศการผสานรวมที่หลากหลายทำให้เป็นมาตรฐานที่น่าสนใจสำหรับการจัดการแอปพลิเคชัน LLM ขั้นสูง

ไม่ว่าคุณจะกำลังสร้างเวิร์กโฟลว์แบบหลายเอเจนต์ แก้ไขข้อบกพร่องในตรรกะ prompt ที่ซับซ้อน หรือพัฒนาโมดูล AI ที่นำกลับมาใช้ใหม่ได้สำหรับการผลิต POML มอบรากฐานใหม่ที่ทรงพลังซึ่งกำลังได้รับความนิยมอย่างรวดเร็วในระบบนิเวศ LLM

Why it matters

💡 ข่าวนี้มีความสำคัญอย่างยิ่งสำหรับนักพัฒนาและผู้ที่ทำงานด้าน AI เนื่องจาก POML เป็นเครื่องมือใหม่จาก Microsoft ที่จะปฏิวัติวิธีการสร้างและจัดการ prompts สำหรับ Large Language Models ด้วยการนำเสนอโครงสร้างที่เป็นระบบ ความสามารถในการนำกลับมาใช้ใหม่ และการบำรุงรักษาที่ง่ายขึ้น ซึ่งจะช่วยแก้ปัญหาความซับซ้อนในการพัฒนาแอปพลิเคชัน AI ที่กำลังเผชิญอยู่ในปัจจุบัน

ข้อมูลอ้างอิงจาก https://www.marktechpost.com/2025/08/13/microsoft-releases-poml-prompt-orchestration-markup-language/

Read more

Bandcamp ประกาศนโยบายแบนเพลงที่สร้างด้วย AI

news

Bandcamp ประกาศนโยบายแบนเพลงที่สร้างด้วย AI

Bandcamp ประกาศนโยบายใหม่แบนเพลงที่สร้างด้วย AI ทั้งหมดหรือส่วนใหญ่ รวมถึงการใช้ AI เลียนแบบศิลปินอื่น เพื่อปกป้องความคิดสร้างสรรค์ของมนุษย์ ขณะที่ค่ายเพลงยักษ์ใหญ่อย่าง UMG และ Warner กลับร่วมมือกับแพลตฟอร์ม AI

By
Apple วางแผนเปลี่ยน Siri ให้เป็นแชทบอท AI เต็มรูปแบบเพื่อแข่งขันกับ ChatGPT และ Gemini

news

Apple วางแผนเปลี่ยน Siri ให้เป็นแชทบอท AI เต็มรูปแบบเพื่อแข่งขันกับ ChatGPT และ Gemini

แอปเปิลกำลังปรับโฉม Siri ครั้งใหญ่ภายใต้โครงการ "Campos" เปลี่ยนเป็นแชทบอท AI เต็มรูปแบบ เพิ่มความสามารถทั้งการค้นหาเว็บ สร้างคอนเทนต์ วิเคราะห์ไฟล์ และเชื่อมโยงกับแอปหลักของ Apple คาดเปิดตัวในงาน WWDC มิถุนายนนี้

By
OpenAI อาจสร้างรายได้จากโฆษณา 25,000 ล้านดอลลาร์ต่อปีภายในปี 2030 สร้างความกังวลให้ Google

news

OpenAI อาจสร้างรายได้จากโฆษณา 25,000 ล้านดอลลาร์ต่อปีภายในปี 2030 สร้างความกังวลให้ Google

นักวิเคราะห์จาก Evercore ISI คาดการณ์ว่า OpenAI จะสร้างรายได้จากโฆษณาถึง 25,000 ล้านดอลลาร์ภายในปี 2030 ท้าทาย Google โดยตรง ด้วยฐานผู้ใช้ ChatGPT เกือบ 1,000 ล้านคนต่อสัปดาห์ และการเริ่มแสดงโฆษณาในอีกไม่กี่สัปดาห์ข้างหน้า

By
สตาร์ทอัพ AI ที่ได้รับการสนับสนุนจาก Alibaba อย่าง Moonshot AI มีมูลค่า 4.8 พันล้านดอลลาร์

news

สตาร์ทอัพ AI ที่ได้รับการสนับสนุนจาก Alibaba อย่าง Moonshot AI มีมูลค่า 4.8 พันล้านดอลลาร์

สตาร์ทอัพ AI จีนที่ได้รับการสนับสนุนจาก Alibaba มีมูลค่าพุ่งสูงถึง 4.8 พันล้านดอลลาร์ แม้จำนวนผู้ใช้ Kimi ลดลงเกือบครึ่ง บริษัทกำลังปรับเปลี่ยนกลยุทธ์จาก Consumer AI สู่บริการ Enterprise ในภาคการเงิน สุขภาพ และกฎหมาย

By