OpenAI ประสบปัญหาติดขัดในการฝึกฝน GPT-5

OpenAI เตรียมเปิดตัวโมเดล AI รุ่นใหม่ที่พัฒนาต่อยอดจาก o1 เน้นการวิเคราะห์แบบหลายขั้นตอนและระบบความปลอดภัยที่แม่นยำขึ้น พร้อมทำคะแนนสูงสุดใน ARC-AGI benchmark และเพิ่มประสิทธิภาพด้าน coding

OpenAI ประสบปัญหาติดขัดในการฝึกฝน GPT-5

Key takeaway

  • OpenAI กำลังพัฒนาโมเดล AI รุ่นใหม่ที่มีความสามารถด้านการวิเคราะห์แบบหลายขั้นตอน (multi-step reasoning) ที่ดีขึ้น และมีระบบความปลอดภัยที่แม่นยำมากขึ้นในการตรวจจับการตอบสนองที่ไม่เหมาะสม
  • โมเดลใหม่นี้สามารถทำคะแนนสูงสุดใน ARC-AGI benchmark ซึ่งเป็นการทดสอบที่ท้าทายสำหรับ AI ในการแก้ปัญหาเชิงภาพและการเรียนรู้ทักษะใหม่
  • โมเดล o3 มีประสิทธิภาพด้าน coding benchmarks สูงกว่าโมเดล o1 ถึง 20% และมีการพัฒนาเวอร์ชัน o3-mini ที่มีต้นทุนต่ำลงแต่ยังคงประสิทธิภาพที่ดี

OpenAI ยังไม่เปิดให้บริการโมเดล AI รุ่นใหม่แก่สาธารณะ แต่เปิดรับนักวิจัยร่วมทดสอบด้านความปลอดภัย (public safety testing) โดยมีกำหนดเปิดตัวอย่างเป็นทางการปลายเดือนมกราคมนี้ Sam Altman ซีอีโอ OpenAI เผยว่าโมเดลใหม่นี้พัฒนาต่อยอดความสามารถด้านการวิเคราะห์แบบหลายขั้นตอน (multi-step reasoning) จากโมเดล o1 และนำมาประยุกต์ใช้กับระบบความปลอดภัย ทำให้ตรวจจับการตอบสนองที่ไม่เหมาะสมได้แม่นยำยิ่งขึ้น

Altman ประกาศเปิดตัวโมเดลใหม่ผ่านการไลฟ์สตรีม พร้อมเผยผลการทดสอบที่ทำคะแนนสูงสุดใน benchmark ที่มีชื่อเสียงว่ายากสำหรับ AI ทั่วไป

หนึ่งในการทดสอบคือ ARC-AGI benchmark ซึ่งเป็นโจทย์ด้านภาพที่ประกอบด้วยรูปแบบสี่เหลี่ยมบนตาราง โดย AI ต้องคิดค้นวิธีแก้ปัญหาเฉพาะสำหรับแต่ละโจทย์ และต้องเรียนรู้ทักษะใหม่ๆ ในการแก้ปัญหาแต่ละข้อ

นอกจากนี้ Altman ยังเปิดเผยว่าโมเดล o3 มีประสิทธิภาพด้าน coding benchmarks สูงกว่าโมเดล o1 ถึง 20% พร้อมย้ำถึงการปรับปรุงประสิทธิภาพและการลดต้นทุนของโมเดล o3-mini ซึ่งเป็นเวอร์ชันขนาดเล็ก

Why it matters

💡 ข่าวนี้มีความสำคัญอย่างยิ่งสำหรับผู้ที่ติดตามความก้าวหน้าด้าน AI เพราะเป็นการเปิดตัวโมเดล AI รุ่นใหม่จาก OpenAI ที่มีความสามารถด้านการวิเคราะห์ขั้นสูงและระบบความปลอดภัยที่แม่นยำกว่าเดิม โดยเฉพาะการทำคะแนนสูงสุดใน benchmark ที่มีชื่อเสียง เช่น ARC-AGI และประสิทธิภาพด้าน coding ที่เพิ่มขึ้นถึง 20% ซึ่งจะส่งผลกระทบต่อการพัฒนาและการประยุกต์ใช้ AI ในอนาคตอันใกล้

ข้อมูลอ้างอิงจาก https://sherwood.news/tech/wsj-openai-is-hitting-a-wall-with-gpt-5-training/

Read more

แฮกเกอร์ใช้ AI ค้นหาช่องโหว่ด้านความปลอดภัยที่ Scanner ทั่วไปตรวจไม่พบ

news

แฮกเกอร์ใช้ AI ค้นหาช่องโหว่ด้านความปลอดภัยที่ Scanner ทั่วไปตรวจไม่พบ

Google เผย แฮกเกอร์ที่รัฐหนุนหลังใช้ AI ค้นหา Zero-Day Vulnerability ที่ Scanner ทั่วไปตรวจไม่พบ รวมถึง Bypass 2FA และพัฒนา Malware ที่ Rewrite ตัวเองได้ ขณะที่ AI ก้าวสู่การเป็น Active Combatant ในสมรภูมิ Cybersecurity

By
Xiaomi เปิดตัว MiMo Code V0.1.0: AI Coding Agent แบบ Open Source อ้างประสิทธิภาพเหนือกว่า Claude Code ในงานหลายขั้นตอน

news

Xiaomi เปิดตัว MiMo Code V0.1.0: AI Coding Agent แบบ Open Source อ้างประสิทธิภาพเหนือกว่า Claude Code ในงานหลายขั้นตอน

Xiaomi เปิดตัว MiMo Code V0.1.0 AI coding agent แบบ open source ใน terminal อ้างประสิทธิภาพเหนือ Claude Code บน SWE-bench พร้อม cross-session memory system และสิทธิ์เข้าถึง MiMo-V2.5 ฟรีช่วงจำกัด

By
บทบาทวิศวกรซอฟต์แวร์เปลี่ยนโฉม จากการเขียนโค้ดสู่การบริหารจัดการ AI

news

บทบาทวิศวกรซอฟต์แวร์เปลี่ยนโฉม จากการเขียนโค้ดสู่การบริหารจัดการ AI

Harness สำรวจกว่า 700 คน พบ AI กำลังเปลี่ยนบทบาทวิศวกรซอฟต์แวร์จากการเขียนโค้ดสู่การบริหาร AI Output โดย 81% ของผู้นำยอมรับเวลาที่ประหยัดได้ถูกใช้ไปกับการ Review แทนการสร้างงานใหม่

By
Standard Chartered ประกาศลดพนักงาน 7,800 ตำแหน่ง เร่งนำ AI มาใช้เต็มรูปแบบ

news

Standard Chartered ประกาศลดพนักงาน 7,800 ตำแหน่ง เร่งนำ AI มาใช้เต็มรูปแบบ

Standard Chartered ประกาศลดพนักงาน Back-Office กว่า 7,800 ตำแหน่งภายในปี 2030 เพื่อนำ AI และ Automation มาใช้เต็มรูปแบบ สอดคล้องกับแนวโน้ม Job Cuts จาก DBS, Meta และ Amazon ที่กำลังเขย่าตลาดแรงงานโลก

By