OpenAI เปิดตัวโมเดล AI ใหม่ "o1" สุดล้ำ

OpenAI ประกาศเปิดตัวโมเดล AI ใหม่ชื่อ "o1" มีสองรุ่นคือ o1-preview และ o1-mini ออกแบบมาเพื่อการใช้เหตุผลและแก้ปัญหาที่ซับซ้อน มีประสิทธิภาพสูงในด้านวิทยาศาสตร์และการเขียนโค้ด พร้อมใช้งานแล้วสำหรับผู้ใช้ ChatGPT Plus

OpenAI เปิดตัวโมเดล AI ใหม่ "o1" สุดล้ำ

Key takeaway

  • OpenAI เปิดตัวโมเดล AI ใหม่ชื่อ "o1" มี 2 รุ่นคือ o1-preview และ o1-mini ที่มีความสามารถในการใช้เหตุผลและแก้ปัญหาซับซ้อนได้ดีกว่า GPT
  • o1-preview มีประสิทธิภาพระดับปริญญาเอกในหลายสาขา เช่น ฟิสิกส์ เคมี ชีววิทยา และการเขียนโค้ด ส่วน o1-mini เป็นเวอร์ชันที่มีประสิทธิภาพสูงขึ้นและราคาถูกลง เหมาะสำหรับงานด้าน STEM
  • OpenAI มีแผนพัฒนาทั้งซีรีส์ GPT และ o1 ต่อไป โดยจะเพิ่มฟีเจอร์ต่างๆ เช่น การท่องเว็บ และการอัปโหลดไฟล์และรูปภาพในอนาคต

นับตั้งแต่การเปิดตัว GPT-4 ซึ่งเป็น large language model (LLM) ที่ทรงพลังของ OpenAI เมื่อเดือนมีนาคม 2023 - 18 เดือนที่แล้ว - ผู้ใช้และนักพัฒนาต่างสงสัยว่าเมื่อไหร่บริษัทที่จุดประกายกระแส generative AI ใน Silicon Valley และทั่วโลกจะเปิดตัวเวอร์ชันถัดไป ซึ่งคาดว่าจะเรียกว่า GPT-5

ปรากฏว่า ซีรีส์ GPT กำลังถูกก้าวข้ามไปด้วยตระกูลโมเดลใหม่ทั้งหมด

วันนี้ หลังจากมีรายงานและข่าวลือมาหลายเดือนซึ่งทวีความเข้มข้นขึ้นในช่วงไม่กี่วันที่ผ่านมา OpenAI ได้ประกาศตระกูลโมเดล AI "o1" โดยเริ่มต้นด้วยสองโมเดล: o1-preview และ o1-mini ซึ่งบริษัทกล่าวว่าได้รับการออกแบบมาเพื่อ "ใช้เหตุผลในการทำงานที่ซับซ้อนและแก้ปัญหาที่ยากกว่า" โมเดลในซีรีส์ GPT

ทั้งสองโมเดลพร้อมใช้งานแล้ววันนี้สำหรับผู้ใช้ ChatGPT Plus แต่ในช่วงแรกจำกัดที่ 30 ข้อความต่อสัปดาห์สำหรับ o1-preview และ 50 สำหรับ o1-mini

อย่างไรก็ตาม OpenAI เตือนว่า "ในฐานะโมเดลรุ่นแรก ยังไม่มีฟีเจอร์หลายอย่างที่ทำให้ ChatGPT มีประโยชน์ เช่น การท่องเว็บเพื่อค้นหาข้อมูลและการอัปโหลดไฟล์และรูปภาพ สำหรับกรณีทั่วไปหลายอย่าง GPT-4o จะมีความสามารถมากกว่าในระยะสั้น"

จากการทดสอบเบื้องต้นของเรา พบว่าไม่สามารถใช้สร้างภาพสำหรับบทความนี้ได้ บนเว็บไซต์แพลตฟอร์ม API ของ OpenAI บริษัทชี้แจงว่าในสถานะเบต้า ตระกูลโมเดลนี้รองรับ "ข้อความเท่านั้น ไม่รองรับรูปภาพ"

o1 ทำอะไรได้ดีกว่า GPT

OpenAI อ้างว่าซีรีส์ o1 ใหม่นี้เหมาะสำหรับผู้ใช้ที่ต้องการแก้ปัญหาที่ซับซ้อนในสาขาต่างๆ เช่น วิทยาศาสตร์ การดูแลสุขภาพ และเทคโนโลยี

OpenAI มองว่าโมเดลเหล่านี้จะถูกนำไปใช้ในแอปพลิเคชันที่หลากหลาย ตั้งแต่การช่วยนักฟิสิกส์สร้างสูตรคณิตศาสตร์สำหรับ quantum optics ไปจนถึงการช่วยนักวิจัยด้านการดูแลสุขภาพในการทำ annotation ข้อมูล cell sequencing

นักพัฒนาจะพบว่าโมเดล o1-mini มีประสิทธิภาพในการสร้างและดำเนินการ multi-step workflows การ debug โค้ด และการแก้ปัญหาการเขียนโปรแกรมอย่างมีประสิทธิภาพ

o1-preview มีประสิทธิภาพระดับปริญญาเอก

โมเดล o1-preview ได้รับการออกแบบมาเพื่อจัดการกับงานที่ท้าทายโดยใช้เวลามากขึ้นในการคิดและปรับปรุงคำตอบ คล้ายกับวิธีที่มนุษย์จะเข้าหาปัญหาที่ซับซ้อน

ในการทดสอบ วิธีการนี้ช่วยให้โมเดลสามารถทำงานได้ในระดับที่ใกล้เคียงกับนักศึกษาปริญญาเอกในสาขาต่างๆ เช่น ฟิสิกส์ เคมี และชีววิทยา

นอกจากนี้ โมเดล o1-preview ยังมีความเชี่ยวชาญในการเขียนโค้ด โดยอยู่ในเปอร์เซ็นต์ไทล์ที่ 89 ในการแข่งขัน Codeforces แสดงให้เห็นถึงความสามารถในการจัดการกับ multi-step workflows การ debug โค้ดที่ซับซ้อน และการสร้างโซลูชันที่แม่นยำ

ในงานทดสอบเกณฑ์มาตรฐานเช่นการสอบคัดเลือก International Mathematics Olympiad (IMO) o1-preview แสดงให้เห็นถึงความสามารถโดยแก้ปัญหาได้ 83% ของโจทย์ทั้งหมด ซึ่งเป็นการพัฒนาที่ดีขึ้นอย่างมากเมื่อเทียบกับอัตราความสำเร็จ 13% ของรุ่นก่อนหน้าอย่าง GPT-4o

โมเดลนี้พร้อมใช้งานแล้วใน ChatGPT สำหรับผู้ใช้ Plus และ Team โดยผู้ใช้ Enterprise และ Edu จะสามารถเข้าถึงได้ในสัปดาห์หน้า นอกจากนี้ โมเดลยังมีให้บริการผ่าน OpenAI API สำหรับนักพัฒนาที่มีคุณสมบัติตรงตาม API usage tier 5 แม้ว่าจะมีการจำกัดอัตราการใช้งานในช่วงแรก

o1-mini มีพลังน้อยกว่าแต่ราคาถูกกว่า 80%

ควบคู่ไปกับ o1-preview OpenAI ยังได้เปิดตัวโมเดล o1-mini ซึ่งเป็นเวอร์ชันที่มีประสิทธิภาพมากขึ้นเพื่อให้ความสามารถในการใช้เหตุผลที่เร็วขึ้นและราคาถูกลง

แม้ว่าจะได้รับการปรับให้เหมาะสมสำหรับงานด้านการเขียนโค้ดและ STEM เป็นหลัก แต่ o1-mini ยังคงมีประสิทธิภาพที่ดี โดยเฉพาะอย่างยิ่งในด้านคณิตศาสตร์และการเขียนโปรแกรม

ในการทดสอบเกณฑ์มาตรฐานคณิตศาสตร์ IMO o1-mini ทำคะแนนได้ 70% ซึ่งใกล้เคียงกับ 74% ของ o1-preview ในขณะที่มีต้นทุนการอนุมานที่ต่ำกว่ามาก นอกจากนี้ยังมีประสิทธิภาพที่แข่งขันได้ในการประเมินการเขียนโค้ด โดยได้คะแนน Elo 1650 บน Codeforces ซึ่งอยู่ในอันดับ 86% แรกของโปรแกรมเมอร์

ด้วยราคาที่ต่ำกว่า 80% เมื่อเทียบกับ o1-preview o1-mini มุ่งเป้าไปที่นักพัฒนาและนักวิจัยที่ต้องการความสามารถในการใช้เหตุผล แต่ไม่จำเป็นต้องมีความรู้ที่กว้างขวางเหมือนกับโมเดล o1-preview ที่ก้าวหน้ากว่า

โซลูชันที่คุ้มค่านี้จะมีให้บริการสำหรับผู้ใช้ ChatGPT Plus, Team, Enterprise และ Edu โดยมีแผนที่จะขยายการเข้าถึงไปยังผู้ใช้ ChatGPT Free ในอนาคต

การปรับปรุงด้านความปลอดภัยและความมั่นคง

สอดคล้องกับความมุ่งมั่นด้านความปลอดภัยของ OpenAI ทั้งสองโมเดลได้รวมวิธีการฝึกอบรมด้านความปลอดภัยใหม่ที่เพิ่มความสามารถในการปฏิบัติตามแนวทางด้านความปลอดภัยและการปรับแนว

OpenAI เน้นย้ำว่า o1-preview ได้คะแนน 84 คะแนนในหนึ่งในการทดสอบ jailbreaking ที่ยากที่สุด ซึ่งเป็นการพัฒนาที่สำคัญเมื่อเทียบกับคะแนน 22 ของ GPT-4o ความสามารถในการใช้เหตุผลเกี่ยวกับกฎความปลอดภัยในบริบทช่วยให้โมเดลเหล่านี้จัดการกับ prompt ที่ไม่ปลอดภัยได้ดีขึ้นและหลีกเลี่ยงการสร้างเนื้อหาที่ไม่เหมาะสม

ในฐานะส่วนหนึ่งของความพยายามด้านความปลอดภัยในวงกว้าง OpenAI ได้เข้าทำข้อตกลงกับสถาบันความปลอดภัยด้าน AI ของสหรัฐอเมริกาและสหราชอาณาจักร

ความร่วมมือเหล่านี้รวมถึงการให้สิทธิ์เข้าถึงเวอร์ชันวิจัยของโมเดล o1 ก่อนกำหนดเพื่อช่วยในการประเมินและทดสอบระบบ AI ในอนาคต

งานด้านความปลอดภัยของ OpenAI ยังรวมถึงการกำกับดูแลภายในที่ครอบคลุมและการทำงานร่วมกับรัฐบาลกลาง ซึ่งเสริมด้วยการทดสอบเป็นประจำ การทำ red-teaming และการกำกับดูแลระดับคณะกรรมการจากคณะกรรมการความปลอดภัยและความมั่นคงของบริษัท

อะไรคือสิ่งที่จะเกิดขึ้นต่อไปสำหรับซีรีส์ o1 ของ OpenAI

แม้ว่าโมเดล o1-preview และ o1-mini จะเป็นเครื่องมือที่ทรงพลังสำหรับการใช้เหตุผลและการแก้ปัญหา แต่ OpenAI ยอมรับว่านี่เป็นเพียงจุดเริ่มต้นเท่านั้น

บริษัทมีแผนที่จะอัปเดตและปรับปรุงโมเดลเหล่านี้อย่างสม่ำเสมอ รวมถึงการเพิ่มฟีเจอร์ต่างๆ เช่น การท่องเว็บ การอัปโหลดไฟล์และรูปภาพ และการเรียกใช้ฟังก์ชัน ซึ่งปัจจุบันยังไม่มีในเวอร์ชัน API

มองไปข้างหน้า OpenAI จะยังคงพัฒนาทั้งซีรีส์ GPT และ o1 ต่อไป เพื่อขยายขีดความสามารถของ AI ในสาขาต่างๆ ผู้ใช้สามารถคาดหวังความก้าวหน้าอย่างต่อเนื่องในขณะที่บริษัททำงานเพื่อเพิ่มประโยชน์และการเข้าถึงโมเดลเหล่านี้ในแอปพลิเคชันต่างๆ

Why it matters

💡
ข่าวนี้น่าสนใจเพราะเป็นการเปิดตัวโมเดล AI รุ่นใหม่จาก OpenAI ที่มีความสามารถสูงกว่า GPT ในด้านการใช้เหตุผลและแก้ปัญหาซับซ้อน โดยเฉพาะในสาขา STEM และการเขียนโค้ด ผู้อ่านจะได้เรียนรู้ถึงความก้าวหน้าล่าสุดของเทคโนโลยี AI รวมถึงแนวโน้มการพัฒนาในอนาคต ซึ่งอาจส่งผลกระทบต่อหลายอุตสาหกรรมและการทำงานในยุคดิจิทัล การติดตามข่าวนี้จะช่วยให้เข้าใจและเตรียมพร้อมรับมือกับการเปลี่ยนแปลงที่กำลังจะเกิดขึ้น

Read more

ภาพแสดงถึงการวิจัยที่ชี้ให้เห็นว่า AI สามารถสร้างข้อมูลเท็จได้ มีภาพหน้ากากหุ่นยนต์ที่มีคำว่า "AI"

News

AI สร้างข้อมูลเท็จ ผลวิจัยชี้ชัด

ผลวิจัยล่าสุดชี้ว่า AI ยังคงสร้างข้อมูลเท็จ โดยเฉพาะชื่อ software packages ที่ไม่มีอยู่จริง ซึ่งอาจนำไปสู่ความเสี่ยงด้านความปลอดภัย นักวิจัยเตือนให้ระมัดระวังในการใช้งาน AI สำหรับงานสำคัญ

By
LinkedIn ใช้ข้อมูลผู้ใช้งานเพื่อฝึก AI สำหรับการสร้างเนื้อหาโดยไม่ได้ขออนุญาตผู้ใช้ล่วงหน้า

News

LinkedIn ใช้ข้อมูลผู้ใช้ฝึก AI โดยไม่ขออนุญาต

LinkedIn ตกเป็นข่าวใหญ่หลังถูกจับได้ว่านำข้อมูลผู้ใช้ไปฝึก AI โดยไม่ขออนุญาต ผู้ใช้สามารถปิดการใช้งานได้ในภายหลัง แต่ข้อมูลที่ถูกนำไปใช้แล้วจะไม่ถูกลบ สะท้อนการแข่งขันด้าน AI ที่ดุเดือดของบริษัทเทคโนโลยี

By
Meta เปิดตัว Llama 3.2 รุ่นใหม่แบบ Open Source เน้นการพัฒนาและปรับปรุงประสิทธิภาพ

News

Meta เปิดตัว Llama 3.2 แบบ Open Source

Meta เปิดตัว Llama 3.2 AI รุ่นใหม่ที่ทำงานบนมือถือได้ มีทั้งหมด 4 รุ่น สามารถวิเคราะห์ภาพและข้อความ เปิดโอกาสให้ผู้ใช้มี AI ส่วนตัวบนอุปกรณ์ โดยไม่ต้องส่งข้อมูลไปยังเซิร์ฟเวอร์

By
ซีอีโอของ OpenAI กล่าวถึงความเป็นไปได้ในการปรับโครงสร้างองค์กร

News

OpenAI อาจปรับโครงสร้าง เพื่อดึงดูดนักลงทุนใหม่

OpenAI กำลังพิจารณาปรับโครงสร้างองค์กรเพื่อดึงดูดนักลงทุนรายใหม่ โดยเฉพาะ MGX จากอาบูดาบี ที่สนใจลงทุนหลายพันล้านดอลลาร์ การเปลี่ยนแปลงนี้อาจส่งผลให้ Microsoft ได้รับส่วนแบ่งความเป็นเจ้าของด้วย

By