OpenAI ประสบปัญหาติดขัดในการฝึกฝน GPT-5

OpenAI เตรียมเปิดตัวโมเดล AI รุ่นใหม่ที่พัฒนาต่อยอดจาก o1 เน้นการวิเคราะห์แบบหลายขั้นตอนและระบบความปลอดภัยที่แม่นยำขึ้น พร้อมทำคะแนนสูงสุดใน ARC-AGI benchmark และเพิ่มประสิทธิภาพด้าน coding

OpenAI ประสบปัญหาติดขัดในการฝึกฝน GPT-5

Key takeaway

  • OpenAI กำลังพัฒนาโมเดล AI รุ่นใหม่ที่มีความสามารถด้านการวิเคราะห์แบบหลายขั้นตอน (multi-step reasoning) ที่ดีขึ้น และมีระบบความปลอดภัยที่แม่นยำมากขึ้นในการตรวจจับการตอบสนองที่ไม่เหมาะสม
  • โมเดลใหม่นี้สามารถทำคะแนนสูงสุดใน ARC-AGI benchmark ซึ่งเป็นการทดสอบที่ท้าทายสำหรับ AI ในการแก้ปัญหาเชิงภาพและการเรียนรู้ทักษะใหม่
  • โมเดล o3 มีประสิทธิภาพด้าน coding benchmarks สูงกว่าโมเดล o1 ถึง 20% และมีการพัฒนาเวอร์ชัน o3-mini ที่มีต้นทุนต่ำลงแต่ยังคงประสิทธิภาพที่ดี

OpenAI ยังไม่เปิดให้บริการโมเดล AI รุ่นใหม่แก่สาธารณะ แต่เปิดรับนักวิจัยร่วมทดสอบด้านความปลอดภัย (public safety testing) โดยมีกำหนดเปิดตัวอย่างเป็นทางการปลายเดือนมกราคมนี้ Sam Altman ซีอีโอ OpenAI เผยว่าโมเดลใหม่นี้พัฒนาต่อยอดความสามารถด้านการวิเคราะห์แบบหลายขั้นตอน (multi-step reasoning) จากโมเดล o1 และนำมาประยุกต์ใช้กับระบบความปลอดภัย ทำให้ตรวจจับการตอบสนองที่ไม่เหมาะสมได้แม่นยำยิ่งขึ้น

Altman ประกาศเปิดตัวโมเดลใหม่ผ่านการไลฟ์สตรีม พร้อมเผยผลการทดสอบที่ทำคะแนนสูงสุดใน benchmark ที่มีชื่อเสียงว่ายากสำหรับ AI ทั่วไป

หนึ่งในการทดสอบคือ ARC-AGI benchmark ซึ่งเป็นโจทย์ด้านภาพที่ประกอบด้วยรูปแบบสี่เหลี่ยมบนตาราง โดย AI ต้องคิดค้นวิธีแก้ปัญหาเฉพาะสำหรับแต่ละโจทย์ และต้องเรียนรู้ทักษะใหม่ๆ ในการแก้ปัญหาแต่ละข้อ

นอกจากนี้ Altman ยังเปิดเผยว่าโมเดล o3 มีประสิทธิภาพด้าน coding benchmarks สูงกว่าโมเดล o1 ถึง 20% พร้อมย้ำถึงการปรับปรุงประสิทธิภาพและการลดต้นทุนของโมเดล o3-mini ซึ่งเป็นเวอร์ชันขนาดเล็ก

Why it matters

💡 ข่าวนี้มีความสำคัญอย่างยิ่งสำหรับผู้ที่ติดตามความก้าวหน้าด้าน AI เพราะเป็นการเปิดตัวโมเดล AI รุ่นใหม่จาก OpenAI ที่มีความสามารถด้านการวิเคราะห์ขั้นสูงและระบบความปลอดภัยที่แม่นยำกว่าเดิม โดยเฉพาะการทำคะแนนสูงสุดใน benchmark ที่มีชื่อเสียง เช่น ARC-AGI และประสิทธิภาพด้าน coding ที่เพิ่มขึ้นถึง 20% ซึ่งจะส่งผลกระทบต่อการพัฒนาและการประยุกต์ใช้ AI ในอนาคตอันใกล้

ข้อมูลอ้างอิงจาก https://sherwood.news/tech/wsj-openai-is-hitting-a-wall-with-gpt-5-training/

Read more

Resolve AI ระดมทุน $125 ล้านด้วยมูลค่า $1 พันล้าน เพื่อพัฒนาระบบบำรุงรักษาแอปพลิเคชันอัตโนมัติ

news

Resolve AI ระดมทุน $125 ล้านด้วยมูลค่า $1 พันล้าน เพื่อพัฒนาระบบบำรุงรักษาแอปพลิเคชันอัตโนมัติ

Resolve AI สตาร์ทอัพที่พัฒนาแพลตฟอร์มแก้ไขปัญหาแอปพลิเคชันอัตโนมัติ ระดมทุน Series A มูลค่า $125 ล้าน จาก Lightspeed และพันธมิตร ส่งผลให้บริษัทมีมูลค่า $1 พันล้าน เงินทุนจะถูกใช้ขยายทีมและพัฒนาโมเดล AI แบบกำหนดเอง

By
นักวิจัยเผยผู้บุกรุก AWS ได้รับสิทธิ์ admin ภายในเวลาไม่ถึง 10 นาที ด้วยความช่วยเหลือจาก AI

news

นักวิจัยเผยผู้บุกรุก AWS ได้รับสิทธิ์ admin ภายในเวลาไม่ถึง 10 นาที ด้วยความช่วยเหลือจาก AI

ผู้บุกรุกใช้ AI เจาะระบบคลาวด์ AWS ได้สิทธิ์แอดมินภายในเวลาไม่ถึง 10 นาที โดยขโมย credentials จาก S3 buckets สาธารณะ ยกระดับสิทธิ์ผ่าน Lambda function และเข้าถึงทรัพยากร AI ของเหยื่อ กรณีนี้แสดงให้เห็นถึงภัยคุกคามใหม่ที่ใช้ AI ช่วยโจมตี

By
จาก Clawdbot สู่ Moltbot: AI Agent นี้ไวรัลและเปลี่ยนตัวตนใหม่ภายใน 72 ชั่วโมงได้อย่างไร

news

จาก Clawdbot สู่ Moltbot: AI Agent นี้ไวรัลและเปลี่ยนตัวตนใหม่ภายใน 72 ชั่วโมงได้อย่างไร

ติดตามเรื่องราวของ Moltbot ผู้ช่วย AI โอเพนซอร์สที่ต้องเปลี่ยนชื่อจาก Clawdbot หลังปัญหาเครื่องหมายการค้ากับ Anthropic เจ้าของ Claude AI พร้อมเรียนรู้คุณสมบัติเด่นที่ทำให้ผู้ช่วย AI นี้น่าสนใจ ทั้งหน่วยความจำถาวร การแจ้งเตือนเชิงรุก และความสามารถในการทำงานอัตโนมัติ

By
รู้จักกับ Prism พื้นที่ทำงานวิจัยฟรีสำหรับนักวิทยาศาสตร์จาก OpenAI

news

รู้จักกับ Prism พื้นที่ทำงานวิจัยฟรีสำหรับนักวิทยาศาสตร์จาก OpenAI

Prism คือพื้นที่ทำงานวิจัยฟรีจาก OpenAI ที่ขับเคลื่อนด้วย GPT-5.2 ช่วยให้นักวิทยาศาสตร์ทำงานร่วมกันได้อย่างมีประสิทธิภาพ รวมการร่าง แก้ไข และเตรียมการตีพิมพ์ไว้ในที่เดียว ใช้งานได้ฟรีสำหรับผู้ใช้ ChatGPT ทุกคน

By