OpenAI เปิดตัวโมเดล AI ใหม่ "o1" สุดล้ำ

OpenAI ประกาศเปิดตัวโมเดล AI ใหม่ชื่อ "o1" มีสองรุ่นคือ o1-preview และ o1-mini ออกแบบมาเพื่อการใช้เหตุผลและแก้ปัญหาที่ซับซ้อน มีประสิทธิภาพสูงในด้านวิทยาศาสตร์และการเขียนโค้ด พร้อมใช้งานแล้วสำหรับผู้ใช้ ChatGPT Plus

OpenAI เปิดตัวโมเดล AI ใหม่ "o1" สุดล้ำ

Key takeaway

  • OpenAI เปิดตัวโมเดล AI ใหม่ชื่อ "o1" มี 2 รุ่นคือ o1-preview และ o1-mini ที่มีความสามารถในการใช้เหตุผลและแก้ปัญหาซับซ้อนได้ดีกว่า GPT
  • o1-preview มีประสิทธิภาพระดับปริญญาเอกในหลายสาขา เช่น ฟิสิกส์ เคมี ชีววิทยา และการเขียนโค้ด ส่วน o1-mini เป็นเวอร์ชันที่มีประสิทธิภาพสูงขึ้นและราคาถูกลง เหมาะสำหรับงานด้าน STEM
  • OpenAI มีแผนพัฒนาทั้งซีรีส์ GPT และ o1 ต่อไป โดยจะเพิ่มฟีเจอร์ต่างๆ เช่น การท่องเว็บ และการอัปโหลดไฟล์และรูปภาพในอนาคต

นับตั้งแต่การเปิดตัว GPT-4 ซึ่งเป็น large language model (LLM) ที่ทรงพลังของ OpenAI เมื่อเดือนมีนาคม 2023 - 18 เดือนที่แล้ว - ผู้ใช้และนักพัฒนาต่างสงสัยว่าเมื่อไหร่บริษัทที่จุดประกายกระแส generative AI ใน Silicon Valley และทั่วโลกจะเปิดตัวเวอร์ชันถัดไป ซึ่งคาดว่าจะเรียกว่า GPT-5

ปรากฏว่า ซีรีส์ GPT กำลังถูกก้าวข้ามไปด้วยตระกูลโมเดลใหม่ทั้งหมด

วันนี้ หลังจากมีรายงานและข่าวลือมาหลายเดือนซึ่งทวีความเข้มข้นขึ้นในช่วงไม่กี่วันที่ผ่านมา OpenAI ได้ประกาศตระกูลโมเดล AI "o1" โดยเริ่มต้นด้วยสองโมเดล: o1-preview และ o1-mini ซึ่งบริษัทกล่าวว่าได้รับการออกแบบมาเพื่อ "ใช้เหตุผลในการทำงานที่ซับซ้อนและแก้ปัญหาที่ยากกว่า" โมเดลในซีรีส์ GPT

ทั้งสองโมเดลพร้อมใช้งานแล้ววันนี้สำหรับผู้ใช้ ChatGPT Plus แต่ในช่วงแรกจำกัดที่ 30 ข้อความต่อสัปดาห์สำหรับ o1-preview และ 50 สำหรับ o1-mini

อย่างไรก็ตาม OpenAI เตือนว่า "ในฐานะโมเดลรุ่นแรก ยังไม่มีฟีเจอร์หลายอย่างที่ทำให้ ChatGPT มีประโยชน์ เช่น การท่องเว็บเพื่อค้นหาข้อมูลและการอัปโหลดไฟล์และรูปภาพ สำหรับกรณีทั่วไปหลายอย่าง GPT-4o จะมีความสามารถมากกว่าในระยะสั้น"

จากการทดสอบเบื้องต้นของเรา พบว่าไม่สามารถใช้สร้างภาพสำหรับบทความนี้ได้ บนเว็บไซต์แพลตฟอร์ม API ของ OpenAI บริษัทชี้แจงว่าในสถานะเบต้า ตระกูลโมเดลนี้รองรับ "ข้อความเท่านั้น ไม่รองรับรูปภาพ"

o1 ทำอะไรได้ดีกว่า GPT

OpenAI อ้างว่าซีรีส์ o1 ใหม่นี้เหมาะสำหรับผู้ใช้ที่ต้องการแก้ปัญหาที่ซับซ้อนในสาขาต่างๆ เช่น วิทยาศาสตร์ การดูแลสุขภาพ และเทคโนโลยี

OpenAI มองว่าโมเดลเหล่านี้จะถูกนำไปใช้ในแอปพลิเคชันที่หลากหลาย ตั้งแต่การช่วยนักฟิสิกส์สร้างสูตรคณิตศาสตร์สำหรับ quantum optics ไปจนถึงการช่วยนักวิจัยด้านการดูแลสุขภาพในการทำ annotation ข้อมูล cell sequencing

นักพัฒนาจะพบว่าโมเดล o1-mini มีประสิทธิภาพในการสร้างและดำเนินการ multi-step workflows การ debug โค้ด และการแก้ปัญหาการเขียนโปรแกรมอย่างมีประสิทธิภาพ

o1-preview มีประสิทธิภาพระดับปริญญาเอก

โมเดล o1-preview ได้รับการออกแบบมาเพื่อจัดการกับงานที่ท้าทายโดยใช้เวลามากขึ้นในการคิดและปรับปรุงคำตอบ คล้ายกับวิธีที่มนุษย์จะเข้าหาปัญหาที่ซับซ้อน

ในการทดสอบ วิธีการนี้ช่วยให้โมเดลสามารถทำงานได้ในระดับที่ใกล้เคียงกับนักศึกษาปริญญาเอกในสาขาต่างๆ เช่น ฟิสิกส์ เคมี และชีววิทยา

นอกจากนี้ โมเดล o1-preview ยังมีความเชี่ยวชาญในการเขียนโค้ด โดยอยู่ในเปอร์เซ็นต์ไทล์ที่ 89 ในการแข่งขัน Codeforces แสดงให้เห็นถึงความสามารถในการจัดการกับ multi-step workflows การ debug โค้ดที่ซับซ้อน และการสร้างโซลูชันที่แม่นยำ

ในงานทดสอบเกณฑ์มาตรฐานเช่นการสอบคัดเลือก International Mathematics Olympiad (IMO) o1-preview แสดงให้เห็นถึงความสามารถโดยแก้ปัญหาได้ 83% ของโจทย์ทั้งหมด ซึ่งเป็นการพัฒนาที่ดีขึ้นอย่างมากเมื่อเทียบกับอัตราความสำเร็จ 13% ของรุ่นก่อนหน้าอย่าง GPT-4o

โมเดลนี้พร้อมใช้งานแล้วใน ChatGPT สำหรับผู้ใช้ Plus และ Team โดยผู้ใช้ Enterprise และ Edu จะสามารถเข้าถึงได้ในสัปดาห์หน้า นอกจากนี้ โมเดลยังมีให้บริการผ่าน OpenAI API สำหรับนักพัฒนาที่มีคุณสมบัติตรงตาม API usage tier 5 แม้ว่าจะมีการจำกัดอัตราการใช้งานในช่วงแรก

o1-mini มีพลังน้อยกว่าแต่ราคาถูกกว่า 80%

ควบคู่ไปกับ o1-preview OpenAI ยังได้เปิดตัวโมเดล o1-mini ซึ่งเป็นเวอร์ชันที่มีประสิทธิภาพมากขึ้นเพื่อให้ความสามารถในการใช้เหตุผลที่เร็วขึ้นและราคาถูกลง

แม้ว่าจะได้รับการปรับให้เหมาะสมสำหรับงานด้านการเขียนโค้ดและ STEM เป็นหลัก แต่ o1-mini ยังคงมีประสิทธิภาพที่ดี โดยเฉพาะอย่างยิ่งในด้านคณิตศาสตร์และการเขียนโปรแกรม

ในการทดสอบเกณฑ์มาตรฐานคณิตศาสตร์ IMO o1-mini ทำคะแนนได้ 70% ซึ่งใกล้เคียงกับ 74% ของ o1-preview ในขณะที่มีต้นทุนการอนุมานที่ต่ำกว่ามาก นอกจากนี้ยังมีประสิทธิภาพที่แข่งขันได้ในการประเมินการเขียนโค้ด โดยได้คะแนน Elo 1650 บน Codeforces ซึ่งอยู่ในอันดับ 86% แรกของโปรแกรมเมอร์

ด้วยราคาที่ต่ำกว่า 80% เมื่อเทียบกับ o1-preview o1-mini มุ่งเป้าไปที่นักพัฒนาและนักวิจัยที่ต้องการความสามารถในการใช้เหตุผล แต่ไม่จำเป็นต้องมีความรู้ที่กว้างขวางเหมือนกับโมเดล o1-preview ที่ก้าวหน้ากว่า

โซลูชันที่คุ้มค่านี้จะมีให้บริการสำหรับผู้ใช้ ChatGPT Plus, Team, Enterprise และ Edu โดยมีแผนที่จะขยายการเข้าถึงไปยังผู้ใช้ ChatGPT Free ในอนาคต

การปรับปรุงด้านความปลอดภัยและความมั่นคง

สอดคล้องกับความมุ่งมั่นด้านความปลอดภัยของ OpenAI ทั้งสองโมเดลได้รวมวิธีการฝึกอบรมด้านความปลอดภัยใหม่ที่เพิ่มความสามารถในการปฏิบัติตามแนวทางด้านความปลอดภัยและการปรับแนว

OpenAI เน้นย้ำว่า o1-preview ได้คะแนน 84 คะแนนในหนึ่งในการทดสอบ jailbreaking ที่ยากที่สุด ซึ่งเป็นการพัฒนาที่สำคัญเมื่อเทียบกับคะแนน 22 ของ GPT-4o ความสามารถในการใช้เหตุผลเกี่ยวกับกฎความปลอดภัยในบริบทช่วยให้โมเดลเหล่านี้จัดการกับ prompt ที่ไม่ปลอดภัยได้ดีขึ้นและหลีกเลี่ยงการสร้างเนื้อหาที่ไม่เหมาะสม

ในฐานะส่วนหนึ่งของความพยายามด้านความปลอดภัยในวงกว้าง OpenAI ได้เข้าทำข้อตกลงกับสถาบันความปลอดภัยด้าน AI ของสหรัฐอเมริกาและสหราชอาณาจักร

ความร่วมมือเหล่านี้รวมถึงการให้สิทธิ์เข้าถึงเวอร์ชันวิจัยของโมเดล o1 ก่อนกำหนดเพื่อช่วยในการประเมินและทดสอบระบบ AI ในอนาคต

งานด้านความปลอดภัยของ OpenAI ยังรวมถึงการกำกับดูแลภายในที่ครอบคลุมและการทำงานร่วมกับรัฐบาลกลาง ซึ่งเสริมด้วยการทดสอบเป็นประจำ การทำ red-teaming และการกำกับดูแลระดับคณะกรรมการจากคณะกรรมการความปลอดภัยและความมั่นคงของบริษัท

อะไรคือสิ่งที่จะเกิดขึ้นต่อไปสำหรับซีรีส์ o1 ของ OpenAI

แม้ว่าโมเดล o1-preview และ o1-mini จะเป็นเครื่องมือที่ทรงพลังสำหรับการใช้เหตุผลและการแก้ปัญหา แต่ OpenAI ยอมรับว่านี่เป็นเพียงจุดเริ่มต้นเท่านั้น

บริษัทมีแผนที่จะอัปเดตและปรับปรุงโมเดลเหล่านี้อย่างสม่ำเสมอ รวมถึงการเพิ่มฟีเจอร์ต่างๆ เช่น การท่องเว็บ การอัปโหลดไฟล์และรูปภาพ และการเรียกใช้ฟังก์ชัน ซึ่งปัจจุบันยังไม่มีในเวอร์ชัน API

มองไปข้างหน้า OpenAI จะยังคงพัฒนาทั้งซีรีส์ GPT และ o1 ต่อไป เพื่อขยายขีดความสามารถของ AI ในสาขาต่างๆ ผู้ใช้สามารถคาดหวังความก้าวหน้าอย่างต่อเนื่องในขณะที่บริษัททำงานเพื่อเพิ่มประโยชน์และการเข้าถึงโมเดลเหล่านี้ในแอปพลิเคชันต่างๆ

Why it matters

💡
ข่าวนี้น่าสนใจเพราะเป็นการเปิดตัวโมเดล AI รุ่นใหม่จาก OpenAI ที่มีความสามารถสูงกว่า GPT ในด้านการใช้เหตุผลและแก้ปัญหาซับซ้อน โดยเฉพาะในสาขา STEM และการเขียนโค้ด ผู้อ่านจะได้เรียนรู้ถึงความก้าวหน้าล่าสุดของเทคโนโลยี AI รวมถึงแนวโน้มการพัฒนาในอนาคต ซึ่งอาจส่งผลกระทบต่อหลายอุตสาหกรรมและการทำงานในยุคดิจิทัล การติดตามข่าวนี้จะช่วยให้เข้าใจและเตรียมพร้อมรับมือกับการเปลี่ยนแปลงที่กำลังจะเกิดขึ้น

Read more

AI Workflow Builders กำลังปฏิวัติการเรียนรู้และพัฒนาในปี 2025

news

AI Workflow Builders กำลังปฏิวัติการเรียนรู้และพัฒนาในปี 2025

ระบบ AI Workflow Builders กำลังปฏิวัติวงการ L&D ด้วยแพลตฟอร์ม no-code ที่ผสานเทคโนโลยี ML, NLP และ Data Analytics สร้างประสบการณ์การเรียนรู้แบบไดนามิกและเฉพาะบุคคล พร้อมระบบวิเคราะห์แบบเรียลไทม์

By
Perplexity ได้รับคำค้นหา 780 ล้านครั้งในเดือนที่แล้ว CEO กล่าว

news

Perplexity ได้รับคำค้นหา 780 ล้านครั้งในเดือนที่แล้ว CEO กล่าว

Perplexity เผยสถิติยอดค้นหาพุ่ง 780 ล้านครั้งในเดือนพฤษภาคม เติบโต 20% ต่อเดือน พร้อมเปิดตัวเบราว์เซอร์ Comet ที่จะปฏิวัติการใช้งาน AI ให้เป็นผู้ช่วยส่วนตัวในชีวิตประจำวัน

By
ซาอุดิอาระเบียมีความทะเยอทะยานด้าน AI สูง แต่อาจมาพร้อมกับต้นทุนด้านสิทธิมนุษยชนแลกมาด้วยสิทธิมนุษยชน

news

ซาอุดิอาระเบียมีความทะเยอทะยานด้าน AI สูง แต่อาจมาพร้อมกับต้นทุนด้านสิทธิมนุษยชนแลกมาด้วยสิทธิมนุษยชน

ซาอุดิอาระเบียทุ่มงบกว่า 4 หมื่นล้านดอลลาร์พัฒนา AI ผ่านบริษัท Humain และร่วมมือกับยักษ์ใหญ่อย่าง NVIDIA แต่นักวิเคราะห์กังวลว่าอาจถูกใช้เป็นเครื่องมือละเมิดสิทธิมนุษยชน

By
ซาอุดิอาระเบียมีความทะเยอทะยานด้าน AI สูง แต่อาจมาพร้อมกับต้นทุนด้านสิทธิมนุษยชนแลกมาด้วยสิทธิมนุษยชน

news

ซาอุดิอาระเบียมีความทะเยอทะยานด้าน AI สูง แต่อาจมาพร้อมกับต้นทุนด้านสิทธิมนุษยชนแลกมาด้วยสิทธิมนุษยชน

ซาอุดิอาระเบียทุ่มงบกว่า 4 หมื่นล้านดอลลาร์พัฒนา AI ผ่านบริษัท Humain และร่วมมือกับยักษ์ใหญ่อย่าง NVIDIA แต่นักวิเคราะห์กังวลว่าอาจถูกใช้เป็นเครื่องมือละเมิดสิทธิมนุษยชน

By