OpenAI ประสบปัญหาติดขัดในการฝึกฝน GPT-5

OpenAI เตรียมเปิดตัวโมเดล AI รุ่นใหม่ที่พัฒนาต่อยอดจาก o1 เน้นการวิเคราะห์แบบหลายขั้นตอนและระบบความปลอดภัยที่แม่นยำขึ้น พร้อมทำคะแนนสูงสุดใน ARC-AGI benchmark และเพิ่มประสิทธิภาพด้าน coding

OpenAI ประสบปัญหาติดขัดในการฝึกฝน GPT-5

Key takeaway

  • OpenAI กำลังพัฒนาโมเดล AI รุ่นใหม่ที่มีความสามารถด้านการวิเคราะห์แบบหลายขั้นตอน (multi-step reasoning) ที่ดีขึ้น และมีระบบความปลอดภัยที่แม่นยำมากขึ้นในการตรวจจับการตอบสนองที่ไม่เหมาะสม
  • โมเดลใหม่นี้สามารถทำคะแนนสูงสุดใน ARC-AGI benchmark ซึ่งเป็นการทดสอบที่ท้าทายสำหรับ AI ในการแก้ปัญหาเชิงภาพและการเรียนรู้ทักษะใหม่
  • โมเดล o3 มีประสิทธิภาพด้าน coding benchmarks สูงกว่าโมเดล o1 ถึง 20% และมีการพัฒนาเวอร์ชัน o3-mini ที่มีต้นทุนต่ำลงแต่ยังคงประสิทธิภาพที่ดี

OpenAI ยังไม่เปิดให้บริการโมเดล AI รุ่นใหม่แก่สาธารณะ แต่เปิดรับนักวิจัยร่วมทดสอบด้านความปลอดภัย (public safety testing) โดยมีกำหนดเปิดตัวอย่างเป็นทางการปลายเดือนมกราคมนี้ Sam Altman ซีอีโอ OpenAI เผยว่าโมเดลใหม่นี้พัฒนาต่อยอดความสามารถด้านการวิเคราะห์แบบหลายขั้นตอน (multi-step reasoning) จากโมเดล o1 และนำมาประยุกต์ใช้กับระบบความปลอดภัย ทำให้ตรวจจับการตอบสนองที่ไม่เหมาะสมได้แม่นยำยิ่งขึ้น

Altman ประกาศเปิดตัวโมเดลใหม่ผ่านการไลฟ์สตรีม พร้อมเผยผลการทดสอบที่ทำคะแนนสูงสุดใน benchmark ที่มีชื่อเสียงว่ายากสำหรับ AI ทั่วไป

หนึ่งในการทดสอบคือ ARC-AGI benchmark ซึ่งเป็นโจทย์ด้านภาพที่ประกอบด้วยรูปแบบสี่เหลี่ยมบนตาราง โดย AI ต้องคิดค้นวิธีแก้ปัญหาเฉพาะสำหรับแต่ละโจทย์ และต้องเรียนรู้ทักษะใหม่ๆ ในการแก้ปัญหาแต่ละข้อ

นอกจากนี้ Altman ยังเปิดเผยว่าโมเดล o3 มีประสิทธิภาพด้าน coding benchmarks สูงกว่าโมเดล o1 ถึง 20% พร้อมย้ำถึงการปรับปรุงประสิทธิภาพและการลดต้นทุนของโมเดล o3-mini ซึ่งเป็นเวอร์ชันขนาดเล็ก

Why it matters

💡 ข่าวนี้มีความสำคัญอย่างยิ่งสำหรับผู้ที่ติดตามความก้าวหน้าด้าน AI เพราะเป็นการเปิดตัวโมเดล AI รุ่นใหม่จาก OpenAI ที่มีความสามารถด้านการวิเคราะห์ขั้นสูงและระบบความปลอดภัยที่แม่นยำกว่าเดิม โดยเฉพาะการทำคะแนนสูงสุดใน benchmark ที่มีชื่อเสียง เช่น ARC-AGI และประสิทธิภาพด้าน coding ที่เพิ่มขึ้นถึง 20% ซึ่งจะส่งผลกระทบต่อการพัฒนาและการประยุกต์ใช้ AI ในอนาคตอันใกล้

ข้อมูลอ้างอิงจาก https://sherwood.news/tech/wsj-openai-is-hitting-a-wall-with-gpt-5-training/

Read more

AI Agents แพร่กระจายทั่วองค์กร 94% ห่วง AI Sprawl เสี่ยงซับซ้อน-ละเมิดความปลอดภัย

news

AI Agents แพร่กระจายทั่วองค์กร 94% ห่วง AI Sprawl เสี่ยงซับซ้อน-ละเมิดความปลอดภัย

OutSystems เผยผลสำรวจ IT Leaders กว่า 1,900 ราย พบ 96% ขององค์กรใช้ AI Agents แล้ว แต่ 94% กังวล AI Sprawl เพิ่มความเสี่ยงด้าน Security มีเพียง 12% ที่มี Centralized Platform รับมือปัญหานี้อย่างจริงจัง

By
Claude, OpenClaw และความเป็นจริงใหม่: ยุค AI Agents มาถึงแล้ว — พร้อมกับความท้าทายที่ต้องเผชิญ

news

Claude, OpenClaw และความเป็นจริงใหม่: ยุค AI Agents มาถึงแล้ว — พร้อมกับความท้าทายที่ต้องเผชิญ

ยุค Agentic AI มาถึงแล้ว! Claude Cowork, OpenClaw และ Google Antigravity กำลังปฏิวัติการทำงาน แต่ก็มาพร้อมความเสี่ยงด้าน Governance และ Responsible AI ที่ทุกภาคส่วนต้องร่วมกันรับมืออย่างจริงจัง

By
Anthropic เปิดตัว Claude Managed Agents เครื่องมือสร้างและ Deploy AI Agents สำหรับธุรกิจ

news

Anthropic เปิดตัว Claude Managed Agents เครื่องมือสร้างและ Deploy AI Agents สำหรับธุรกิจ

Anthropic เปิดตัว Claude Managed Agents เครื่องมือสำหรับธุรกิจในการสร้างและ Deploy AI Agents พร้อม Infrastructure แบบ Out-of-the-Box ลดความซับซ้อนทางเทคนิค ขณะที่ ARR ของบริษัทพุ่งทะลุ 3 หมื่นล้านดอลลาร์

By