Microsoft เปิดตัว POML (Prompt Orchestration Markup Language)

Microsoft เปิดตัว Prompt Orchestration Markup Language (POML) เฟรมเวิร์กโอเพนซอร์สใหม่ที่ช่วยให้นักพัฒนาสร้าง AI prompt ที่ซับซ้อนได้ง่ายขึ้น พร้อมฟีเจอร์การจัดการข้อมูล การสร้างเทมเพลต และเครื่องมือสำหรับนักพัฒนา

Microsoft เปิดตัว POML (Prompt Orchestration Markup Language)

Key takeaway

  • POML เป็นภาษามาร์กอัปตัวใหม่จาก Microsoft ที่ช่วยให้การเขียน Prompt สำหรับ LLM มีโครงสร้างที่เป็นระเบียบ สามารถนำกลับมาใช้ใหม่ได้ และขยายความสามารถได้ง่าย โดยใช้รูปแบบคล้าย HTML/XML
  • POML มีคุณสมบัติหลักที่โดดเด่นคือ การจัดการโครงสร้าง Prompt ด้วย Element ต่างๆ เช่น,, รองรับการใช้งานข้อมูลหลากหลายรูปแบบ และมีระบบ Stylesheet แยกการจัดรูปแบบออกจากเนื้อหา
  • มีเครื่องมือสนับสนุนการพัฒนาที่ครบครัน ทั้ง VS Code Extension, SDK สำหรับ Node.js และ Python รวมถึงระบบ Template ที่ช่วยให้สร้าง Prompt แบบไดนามิกได้ ทำให้นักพัฒนาสามารถจัดการ Prompt ที่ซับซ้อนได้อย่างมีประสิทธิภาพ

การออกแบบ Prompt กลายเป็นรากฐานสำคัญในการพัฒนาแอปพลิเคชันขั้นสูงที่ขับเคลื่อนด้วย Large Language Models (LLMs) แล้ว เมื่อ prompt มีความซับซ้อนมากขึ้น ทั้งองค์ประกอบแบบไดนามิก บทบาทหลากหลาย ข้อมูลแบบมีโครงสร้าง และรูปแบบเอาต์พุตที่หลากหลาย ข้อจำกัดของการใช้ข้อความแบบไม่มีโครงสร้างก็เริ่มปรากฏชัดเจน Microsoft จึงได้เปิดตัว Prompt Orchestration Markup Language (POML) เฟรมเวิร์กโอเพนซอร์สใหม่ที่ออกแบบมาเพื่อสร้างระเบียบ ความเป็นโมดูลาร์ และความสามารถในการขยายให้กับการออกแบบ prompt สำหรับ LLMs

POML คืออะไร?

POML เป็นภาษามาร์กอัปที่ได้แรงบันดาลใจจาก HTML/XML ออกแบบมาเพื่อสร้าง AI prompt ที่ซับซ้อน บำรุงรักษาได้ และนำกลับมาใช้ใหม่ได้ โดยมีวิธีการเป็นระบบสำหรับ:

  • กำหนดโครงสร้าง prompt โดยใช้คอมโพเนนต์เชิงความหมายและบทบาท
  • ผสานรวมประเภทข้อมูลที่หลากหลายและทรัพยากรภายนอก
  • แยกเนื้อหาออกจากการนำเสนอด้วย stylesheet
  • เปิดใช้งานเทมเพลตขั้นสูงและตรรกะตัวแปรสำหรับการสร้าง prompt แบบไดนามิก
  • สนับสนุนนักพัฒนาด้วยระบบนิเวศของเครื่องมือที่แข็งแกร่ง

คุณสมบัติหลัก

1. โครงสร้าง Prompt Markup

POML ใช้องค์ประกอบที่ชัดเจนเชิงความหมาย เช่น <role>, <task> และ <example> เพื่อกำหนดส่วนต่างๆ ทางตรรกะของ prompt การออกแบบแบบโมดูลาร์นี้ทำให้ prompt อ่านง่าย บำรุงรักษาได้ และนำกลับมาใช้ใหม่ได้สูง

<poml>
  <role>You are a science teacher.</role>
  <task>Explain gravity using the image below.</task>
  <img src="gravity_diagram.png" alt="Diagram of gravity" />
  <output-format>
    Use simple language and keep your answer under 50 words.
  </output-format>
</poml>

วิธีการนี้ช่วยกำจัดปัญหาการจัดรูปแบบที่เปราะบางที่มักพบใน "prompt spaghetti" และส่งเสริมการแยกความรับผิดชอบอย่างชัดเจน

2. การจัดการข้อมูลแบบครอบคลุม

POML รองรับการฝังหรืออ้างอิงข้อมูลภายนอกประเภทต่างๆ:

  • เอกสารข้อความ (<document>)
  • สเปรดชีตและตาราง (<table>)
  • รูปภาพ (<img>)
  • รูปแบบอื่นๆ ตามความจำเป็น

ทำให้สามารถผสานรวมเอกสารอ้างอิง ชุดข้อมูลการสอน และสื่อภาพได้อย่างราบรื่นภายใน prompt

3. การแยกรูปแบบการนำเสนอ

ได้รับแรงบันดาลใจจาก CSS, POML สนับสนุนระบบสไตล์ที่แยกเนื้อหาออกจากการจัดรูปแบบและข้อจำกัดของเอาต์พุต สไตล์สามารถระบุใน <stylesheet> หรือด้วยแอตทริบิวต์แบบอินไลน์ ทำให้สามารถปรับเปลี่ยนได้ง่ายโดยไม่ต้องแตะโครงสร้างทางตรรกะของ prompt

4. เครื่องมือสร้างเทมเพลตแบบบูรณาการ

POML รวมเครื่องมือสร้างเทมเพลตที่ทรงพลังซึ่งสนับสนุน:

  • ตัวแปรและการแทนที่
  • เงื่อนไขและลูป
  • การรวมโมดูลและการนำกลับมาใช้ใหม่

ระบบไดนามิกนี้ช่วยให้นักพัฒนาสามารถสร้าง prompt แบบโปรแกรมและจัดการกับรูปแบบที่ซับซ้อนในระดับใหญ่

5. ระบบนิเวศของเครื่องมือที่หลากหลาย

ภาษานี้มีชุดเครื่องมือสำหรับนักพัฒนา:

  • VS Code Extension: ให้การไฮไลต์ไวยากรณ์ การเติมอัตโนมัติ เอกสารเมื่อวางเมาส์ การวินิจฉัย และการพรีวิวสดของการจัดรูปแบบและตรรกะของ prompt
  • SDKs: POML มีไลบรารีสำหรับ Node.js (TypeScript/JavaScript) และ Python ช่วยให้ผสานรวมกับเวิร์กโฟลว์ที่มีอยู่และเฟรมเวิร์ก LLM ยอดนิยมได้ง่าย

การกำหนดค่ากับผู้ให้บริการ LLM ที่คุณต้องการ (เช่น OpenAI, Azure) ก็ทำได้อย่างตรงไปตรงมา ช่วยให้ทดสอบและปรับใช้ได้อย่างรวดเร็ว

สถาปัตยกรรมทางเทคนิคและปรัชญา

POML ถูกออกแบบให้เป็น "view layer" เหมือนกับที่พบในการพัฒนาฟรอนต์เอนด์แบบดั้งเดิม (สถาปัตยกรรม MVC) มาร์กอัปกำหนดการนำเสนอ ไม่ใช่ตรรกะทางธุรกิจหรือการเข้าถึงข้อมูล ช่วยให้แยกส่วนได้อย่างชัดเจนและทำให้ง่ายต่อการปรับโครงสร้าง prompt, ทดสอบรูปแบบต่างๆ และรับประกันความสอดคล้องกันในเวิร์กโฟลว์ของเอเจนต์และการทดสอบอัตโนมัติ

การติดตั้งและเริ่มต้น

POML เป็นโอเพนซอร์ส (MIT License) และมีให้บน GitHub คุณสามารถ:

  • ติดตั้ง VS Code extension จาก marketplace
  • ใช้ Node.js (npm install pomljs) หรือ Python (pip install poml) SDKs
  • อ้างอิงเอกสาร POML โดยละเอียดสำหรับไวยากรณ์ ตัวอย่าง และคู่มือการผสานรวม

Prompt Orchestration Markup Language (POML) นำโครงสร้าง ความสามารถในการขยาย และความสามารถในการบำรุงรักษาที่จำเป็นอย่างมากมาสู่การออกแบบ prompt สำหรับนักพัฒนา AI ไวยากรณ์แบบโมดูลาร์ การจัดการข้อมูลแบบครอบคลุม การแยกสไตล์ การสร้างเทมเพลตแบบไดนามิก และระบบนิเวศการผสานรวมที่หลากหลายทำให้เป็นมาตรฐานที่น่าสนใจสำหรับการจัดการแอปพลิเคชัน LLM ขั้นสูง

ไม่ว่าคุณจะกำลังสร้างเวิร์กโฟลว์แบบหลายเอเจนต์ แก้ไขข้อบกพร่องในตรรกะ prompt ที่ซับซ้อน หรือพัฒนาโมดูล AI ที่นำกลับมาใช้ใหม่ได้สำหรับการผลิต POML มอบรากฐานใหม่ที่ทรงพลังซึ่งกำลังได้รับความนิยมอย่างรวดเร็วในระบบนิเวศ LLM

Why it matters

💡 ข่าวนี้มีความสำคัญอย่างยิ่งสำหรับนักพัฒนาและผู้ที่ทำงานด้าน AI เนื่องจาก POML เป็นเครื่องมือใหม่จาก Microsoft ที่จะปฏิวัติวิธีการสร้างและจัดการ prompts สำหรับ Large Language Models ด้วยการนำเสนอโครงสร้างที่เป็นระบบ ความสามารถในการนำกลับมาใช้ใหม่ และการบำรุงรักษาที่ง่ายขึ้น ซึ่งจะช่วยแก้ปัญหาความซับซ้อนในการพัฒนาแอปพลิเคชัน AI ที่กำลังเผชิญอยู่ในปัจจุบัน

ข้อมูลอ้างอิงจาก https://www.marktechpost.com/2025/08/13/microsoft-releases-poml-prompt-orchestration-markup-language/

Read more

เบราว์เซอร์ Comet AI จาก Perplexity เปิดให้ทุกคนใช้งานแล้ว

news

เบราว์เซอร์ Comet AI จาก Perplexity เปิดให้ทุกคนใช้งานแล้ว

Perplexity เปิดตัว Comet เว็บเบราว์เซอร์ AI ให้ทุกคนใช้งานฟรี มาพร้อมผู้ช่วย AI อัจฉริยะที่ตอบคำถามและทำงานแทนผู้ใช้ได้ ท้าทายการครองตลาดของ Google Chrome

By
ชายวัย 29 ปีถูกจับกุมหลังใช้ ChatGPT สร้างภาพไฟไหม้ก่อนก่อเหตุจริง

news

ชายวัย 29 ปีถูกจับกุมหลังใช้ ChatGPT สร้างภาพไฟไหม้ก่อนก่อเหตุจริง

ตำรวจจับกุม Jonathan Rinderknecht วัย 29 ปี ผู้ต้องสงสัยก่อเหตุไฟไหม้ใน Pacific Palisades หลังพบหลักฐานใช้ ChatGPT สร้างภาพเหตุการณ์ล่วงหน้า 5 เดือน เหตุคร่าชีวิต 12 ราย บ้านเสียหายกว่า 6,000 หลัง

By
การหยุดชะงักของระบบ IT ทำให้ธุรกิจสูญเสียเงิน 76 ล้านดอลลาร์ต่อปี

news

การหยุดชะงักของระบบ IT ทำให้ธุรกิจสูญเสียเงิน 76 ล้านดอลลาร์ต่อปี

ผลการศึกษาจาก New Relic เผยการหยุดชะงักของระบบ IT ทำให้ธุรกิจสูญเสียเงินมัธยฐาน 76 ล้านดอลลาร์ต่อปี หรือ 33,333 ดอลลาร์ต่อนาที พร้อมเผยสาเหตุหลักและแนวทางแก้ไข

By
โรงพยาบาลจำเป็นต้องเตรียมพร้อมรับมือการโจมตีแบบฟิชชิ่งที่ใช้ AI

news

โรงพยาบาลจำเป็นต้องเตรียมพร้อมรับมือการโจมตีแบบฟิชชิ่งที่ใช้ AI

ภัยคุกคามจากการโจมตีฟิชชิ่งที่ใช้ AI ในโรงพยาบาลเพิ่มขึ้นกว่า 700% ในปี 2024 สร้างความเสี่ยงต่อข้อมูลผู้ป่วยและระบบสาธารณสุข จำเป็นต้องเพิ่มการฝึกอบรมและระบบป้องกันอย่างเร่งด่วน

By