OpenAI ประสบปัญหาติดขัดในการฝึกฝน GPT-5

OpenAI เตรียมเปิดตัวโมเดล AI รุ่นใหม่ที่พัฒนาต่อยอดจาก o1 เน้นการวิเคราะห์แบบหลายขั้นตอนและระบบความปลอดภัยที่แม่นยำขึ้น พร้อมทำคะแนนสูงสุดใน ARC-AGI benchmark และเพิ่มประสิทธิภาพด้าน coding

OpenAI ประสบปัญหาติดขัดในการฝึกฝน GPT-5

Key takeaway

  • OpenAI กำลังพัฒนาโมเดล AI รุ่นใหม่ที่มีความสามารถด้านการวิเคราะห์แบบหลายขั้นตอน (multi-step reasoning) ที่ดีขึ้น และมีระบบความปลอดภัยที่แม่นยำมากขึ้นในการตรวจจับการตอบสนองที่ไม่เหมาะสม
  • โมเดลใหม่นี้สามารถทำคะแนนสูงสุดใน ARC-AGI benchmark ซึ่งเป็นการทดสอบที่ท้าทายสำหรับ AI ในการแก้ปัญหาเชิงภาพและการเรียนรู้ทักษะใหม่
  • โมเดล o3 มีประสิทธิภาพด้าน coding benchmarks สูงกว่าโมเดล o1 ถึง 20% และมีการพัฒนาเวอร์ชัน o3-mini ที่มีต้นทุนต่ำลงแต่ยังคงประสิทธิภาพที่ดี

OpenAI ยังไม่เปิดให้บริการโมเดล AI รุ่นใหม่แก่สาธารณะ แต่เปิดรับนักวิจัยร่วมทดสอบด้านความปลอดภัย (public safety testing) โดยมีกำหนดเปิดตัวอย่างเป็นทางการปลายเดือนมกราคมนี้ Sam Altman ซีอีโอ OpenAI เผยว่าโมเดลใหม่นี้พัฒนาต่อยอดความสามารถด้านการวิเคราะห์แบบหลายขั้นตอน (multi-step reasoning) จากโมเดล o1 และนำมาประยุกต์ใช้กับระบบความปลอดภัย ทำให้ตรวจจับการตอบสนองที่ไม่เหมาะสมได้แม่นยำยิ่งขึ้น

Altman ประกาศเปิดตัวโมเดลใหม่ผ่านการไลฟ์สตรีม พร้อมเผยผลการทดสอบที่ทำคะแนนสูงสุดใน benchmark ที่มีชื่อเสียงว่ายากสำหรับ AI ทั่วไป

หนึ่งในการทดสอบคือ ARC-AGI benchmark ซึ่งเป็นโจทย์ด้านภาพที่ประกอบด้วยรูปแบบสี่เหลี่ยมบนตาราง โดย AI ต้องคิดค้นวิธีแก้ปัญหาเฉพาะสำหรับแต่ละโจทย์ และต้องเรียนรู้ทักษะใหม่ๆ ในการแก้ปัญหาแต่ละข้อ

นอกจากนี้ Altman ยังเปิดเผยว่าโมเดล o3 มีประสิทธิภาพด้าน coding benchmarks สูงกว่าโมเดล o1 ถึง 20% พร้อมย้ำถึงการปรับปรุงประสิทธิภาพและการลดต้นทุนของโมเดล o3-mini ซึ่งเป็นเวอร์ชันขนาดเล็ก

Why it matters

💡 ข่าวนี้มีความสำคัญอย่างยิ่งสำหรับผู้ที่ติดตามความก้าวหน้าด้าน AI เพราะเป็นการเปิดตัวโมเดล AI รุ่นใหม่จาก OpenAI ที่มีความสามารถด้านการวิเคราะห์ขั้นสูงและระบบความปลอดภัยที่แม่นยำกว่าเดิม โดยเฉพาะการทำคะแนนสูงสุดใน benchmark ที่มีชื่อเสียง เช่น ARC-AGI และประสิทธิภาพด้าน coding ที่เพิ่มขึ้นถึง 20% ซึ่งจะส่งผลกระทบต่อการพัฒนาและการประยุกต์ใช้ AI ในอนาคตอันใกล้

ข้อมูลอ้างอิงจาก https://sherwood.news/tech/wsj-openai-is-hitting-a-wall-with-gpt-5-training/

Read more

Xiaomi เปิดตัว MiMo Code V0.1.0: AI Coding Agent แบบ Open Source อ้างประสิทธิภาพเหนือกว่า Claude Code ในงานหลายขั้นตอน

news

Xiaomi เปิดตัว MiMo Code V0.1.0: AI Coding Agent แบบ Open Source อ้างประสิทธิภาพเหนือกว่า Claude Code ในงานหลายขั้นตอน

Xiaomi เปิดตัว MiMo Code V0.1.0 AI coding agent แบบ open source ใน terminal อ้างประสิทธิภาพเหนือ Claude Code บน SWE-bench พร้อม cross-session memory system และสิทธิ์เข้าถึง MiMo-V2.5 ฟรีช่วงจำกัด

By
บทบาทวิศวกรซอฟต์แวร์เปลี่ยนโฉม จากการเขียนโค้ดสู่การบริหารจัดการ AI

news

บทบาทวิศวกรซอฟต์แวร์เปลี่ยนโฉม จากการเขียนโค้ดสู่การบริหารจัดการ AI

Harness สำรวจกว่า 700 คน พบ AI กำลังเปลี่ยนบทบาทวิศวกรซอฟต์แวร์จากการเขียนโค้ดสู่การบริหาร AI Output โดย 81% ของผู้นำยอมรับเวลาที่ประหยัดได้ถูกใช้ไปกับการ Review แทนการสร้างงานใหม่

By
Standard Chartered ประกาศลดพนักงาน 7,800 ตำแหน่ง เร่งนำ AI มาใช้เต็มรูปแบบ

news

Standard Chartered ประกาศลดพนักงาน 7,800 ตำแหน่ง เร่งนำ AI มาใช้เต็มรูปแบบ

Standard Chartered ประกาศลดพนักงาน Back-Office กว่า 7,800 ตำแหน่งภายในปี 2030 เพื่อนำ AI และ Automation มาใช้เต็มรูปแบบ สอดคล้องกับแนวโน้ม Job Cuts จาก DBS, Meta และ Amazon ที่กำลังเขย่าตลาดแรงงานโลก

By
แฮกเกอร์กลุ่ม TeamPCP โฆษณาขาย Source Code Repository ของ Mistral AI กว่า 450 ชุด

news

แฮกเกอร์กลุ่ม TeamPCP โฆษณาขาย Source Code Repository ของ Mistral AI กว่า 450 ชุด

TeamPCP อ้างเจาะระบบ Mistral AI ขโมย Source Code กว่า 450 Repository ขนาดเกือบ 5 GB ผ่าน TanStack Supply-Chain Attack ก่อนประกาศขาย $25,000 โดย Mistral AI ยืนยันถูกโจมตีจริง แต่ระบุว่า Core System ไม่ได้รับผลกระทบ

By