Google Gemini 2.5 Pro อาจเป็นโมเดล AI ที่สำคัญที่สุดในปีนี้

Google เปิดตัว Gemini 2.5 Pro โมเดล AI รุ่นใหม่ที่ทำคะแนนสูงสุดในการทดสอบหลายด้าน ทั้งการเขียนโค้ด คณิตศาสตร์ และการให้เหตุผล รองรับการประมวลผลข้อมูลได้ถึง 1 ล้าน token พร้อมฐานความรู้ล่าสุดถึงต้นปี 2025

Google Gemini 2.5 Pro อาจเป็นโมเดล AI ที่สำคัญที่สุดในปีนี้

Key takeaway

  • Gemini 2.5 Pro สร้างสถิติใหม่ในการทดสอบ Fiction.liveBench โดยแสดงความสามารถในการประมวลผลข้อมูลขนาดใหญ่ (context window) ได้ถึง 1 ล้าน token และมีความเข้าใจบริบทที่ดีกว่าคู่แข่งอย่าง OpenAI และ Anthropic โดยเฉพาะเมื่อต้องจัดการกับข้อมูลขนาด 32K, 60K และ 120K tokens
  • โมเดลนี้ทำคะแนนโดดเด่นในการทดสอบ MathArena ด้วยคะแนน 24.4% ซึ่งสูงกว่าคู่แข่งที่ทำได้ไม่ถึง 5% แสดงให้เห็นถึงความสามารถในการแก้ปัญหาคณิตศาสตร์ระดับสูงที่มาจากการแข่งขัน Math Olympiad
  • Gemini 2.5 Pro ยังทำผลงานได้ดีในการทดสอบ Humanity's Last Exam ด้วยคะแนน 18.8% ซึ่งเป็นการทดสอบที่วัดความสามารถในการให้เหตุผลระดับผู้เชี่ยวชาญ และปัจจุบันยังครองอันดับหนึ่งใน LMArena ซึ่งเป็น benchmark แบบ crowdsourced

Google เปิดตัว Gemini 2.5 Pro อาจเป็นโมเดล AI ที่สำคัญที่สุดของปีนี้

Google ได้เปิดตัวโมเดล AI ทดลองใหม่ Gemini 2.5 Pro เมื่อเดือนที่ผ่านมา โดยสามารถทำคะแนนสูงสุดในการทดสอบ benchmark ด้านการเขียนโค้ด คณิตศาสตร์ และการให้เหตุผล จนได้รับการยอมรับว่าเป็นหนึ่งในโมเดล AI ที่ทรงประสิทธิภาพที่สุดในโลกขณะนี้

Gemini 2.5 Pro จัดเป็นโมเดลประเภท "reasoning" ที่สร้างคำตอบจากการผสมผสานระหว่างข้อมูลที่ได้รับการเทรนและการประมวลผลแบบเรียลไทม์ตามคำถามของผู้ใช้ เช่นเดียวกับโมเดลใหม่อื่นๆ Gemini 2.5 Pro มีความสามารถในการค้นหาข้อมูลจากเว็บ และมีฐานความรู้ที่ทันสมัยถึงสิ้นเดือนมกราคม 2025

ในช่วงปีที่ผ่านมา นักวิจัย AI เริ่มปรับเปลี่ยนแนวทางโดยพัฒนาให้โมเดล "ให้เหตุผล" ขณะกำลังตอบคำถามของผู้ใช้ วิธีการนี้จำเป็นต้องให้โมเดลประมวลผลและจัดเก็บข้อมูลในปริมาณมากขึ้น (Gemini 2.5 Pro รองรับได้ถึง 1 ล้าน token) อย่างไรก็ตาม โมเดลส่วนใหญ่มักประสบปัญหา information overload ทำให้ยากต่อการดึงข้อมูลที่มีความหมายจากบริบททั้งหมด

Google ดูเหมือนจะมีความก้าวหน้าในการแก้ปัญหานี้ ช่อง YouTube "AI Explained" ชี้ให้เห็นว่า Gemini 2.5 ทำผลงานได้โดดเด่นในการทดสอบ benchmark ใหม่ที่เรียกว่า Fiction.liveBench ซึ่งออกแบบมาเพื่อทดสอบความสามารถของโมเดลในการจดจำและเข้าใจข้อมูลบริบท โมเดลชั้นนำจาก OpenAI และ Anthropic ทำคะแนนได้ดีเมื่อ context window มีขนาดเล็ก แต่เมื่อขยายเป็น 32K, 60K และ 120K (เทียบเท่ากับนวนิยายขนาดสั้น) Gemini 2.5 Pro แสดงศักยภาพด้วยความเข้าใจที่เหนือชั้นกว่า

ความสำคัญของการพัฒนานี้อยู่ที่การใช้งาน generative AI ที่มีประสิทธิภาพสูงมักเกี่ยวข้องกับการทำความเข้าใจและสรุปข้อมูลจำนวนมหาศาล ตัวอย่างเช่น พนักงานบริการลูกค้าที่ต้องค้นหาข้อมูลจากคู่มือจำนวนมาก หรือเจ้าหน้าที่ compliance ที่ต้องใช้ context window ขนาดใหญ่เพื่อสืบค้นข้อมูลจากกฎระเบียบที่สะสมมาหลายปี

นอกจากนี้ Gemini ยังทำคะแนนเหนือกว่าโมเดลคู่แข่งใน benchmark ใหม่อย่าง MathArena ซึ่งทดสอบโมเดลด้วยโจทย์คณิตศาสตร์ระดับยากจากการแข่งขัน Math Olympiad โดยโมเดลชั้นนำจาก OpenAI, Anthropic และ DeepSeek ทำคะแนนไม่ถึง 5% ในขณะที่ Gemini 2.5 Pro ทำคะแนนได้สูงถึง 24.4%

ที่น่าสนใจไม่น้อยคือ โมเดลใหม่ของ Google ยังทำคะแนนสูงใน benchmark ที่ท้าทายอย่าง Humanity's Last Exam ซึ่งออกแบบเพื่อแสดงให้เห็นว่าเมื่อใดที่โมเดล AI จะมีความสามารถเหนือกว่าความรู้และการให้เหตุผลของผู้เชี่ยวชาญระดับสูง โดย Gemini 2.5 ทำคะแนนได้ถึง 18.8% รองจาก OpenAI's Deep Research model เท่านั้น และปัจจุบันยังครองอันดับหนึ่งใน leaderboard การทดสอบ benchmark แบบ crowdsourced อย่าง LMArena

Why it matters

💡 ข่าวนี้มีความสำคัญอย่างยิ่งสำหรับผู้ที่สนใจพัฒนาการล่าสุดในวงการ AI เนื่องจาก Gemini 2.5 Pro ได้แสดงให้เห็นถึงความก้าวหน้าที่โดดเด่นในการประมวลผลข้อมูลขนาดใหญ่และการให้เหตุผล โดยทำลายสถิติในการทดสอบหลายรายการ ทั้งด้านคณิตศาสตร์ การเขียนโค้ด และความเข้าใจบริบท การพัฒนานี้จะส่งผลกระทบอย่างมีนัยสำคัญต่อการประยุกต์ใช้ AI ในภาคธุรกิจและอุตสาหกรรม โดยเฉพาะงานที่ต้องการการวิเคราะห์ข้อมูลจำนวนมากและการตัดสินใจที่ซับซ้อน

ข้อมูลอ้างอิงจาก https://www.fastcompany.com/91311063/google-gemini-2-5-pro-testing?utm_source=flipboard&utm_content=topic%2Fartificialintelligence

Read more

สตาร์ทอัพซีแอตเทิลเปิดตัวแว่นตาอัจฉริยะที่ขับเคลื่อนด้วย AI สำหรับช่างมุงหลังคาและช่างไฟฟ้า

news

สตาร์ทอัพซีแอตเทิลเปิดตัวแว่นตาอัจฉริยะที่ขับเคลื่อนด้วย AI สำหรับช่างมุงหลังคาและช่างไฟฟ้า

สตาร์ทอัพซีแอตเทิล Zuper เปิดตัว "Zuper Glass" แว่นตาอัจฉริยะที่ขับเคลื่อนด้วย AI สำหรับช่างเทคนิค ช่วยให้ถ่ายภาพ บันทึกวิดีโอ และสื่อสารได้โดยมือยังว่างพร้อมทำงาน ซิงค์ข้อมูลแบบเรียลไทม์กับแพลตฟอร์มหลักของบริษัท

By
SK Hynix ผู้ผลิตชิ้นส่วนสำคัญของ Nvidia ขายหมดล่วงหน้าถึงปี 2026 เนื่องจากความต้องการด้าน AI พุ่งสูง

news

SK Hynix ผู้ผลิตชิ้นส่วนสำคัญของ Nvidia ขายหมดล่วงหน้าถึงปี 2026 เนื่องจากความต้องการด้าน AI พุ่งสูง

SK Hynix รายงานผลประกอบการไตรมาส 3 ทำลายสถิติด้วยรายได้ 24.45 ล้านล้านวอน เติบโต 39% จากปีก่อน เนื่องจากความต้องการชิป HBM สำหรับ AI พุ่งสูง ครองส่วนแบ่งตลาด 64% และขายหมดล่วงหน้าถึงปี 2026

By
สตาร์ทอัพระบบปฏิบัติการ AI "UnifyApps" ระดมทุน 50 ล้านดอลลาร์ พร้อมแต่งตั้ง Co-CEO คนใหม่

news

สตาร์ทอัพระบบปฏิบัติการ AI "UnifyApps" ระดมทุน 50 ล้านดอลลาร์ พร้อมแต่งตั้ง Co-CEO คนใหม่

UnifyApps สตาร์ทอัพด้านระบบปฏิบัติการ AI ประสบความสำเร็จในการระดมทุน 50 ล้านดอลลาร์ นำโดย WestBridge Capital พร้อมแต่งตั้ง Ragy Thomas เป็น Co-CEO คนใหม่ มุ่งพัฒนาโซลูชัน AI สำหรับองค์กร

By
Amazon สั่ง Perplexity ยุติการใช้ AI Agent สำหรับการช้อปปิ้งแทนผู้ใช้

news

Amazon สั่ง Perplexity ยุติการใช้ AI Agent สำหรับการช้อปปิ้งแทนผู้ใช้

อเมซอนสั่งให้ Perplexity ยุติการใช้ Comet AI Agent ที่ช้อปปิ้งแทนผู้ใช้ อ้างละเมิดข้อกำหนดและฉ้อโกงคอมพิวเตอร์ ขณะที่ Perplexity โต้กลับว่าอเมซอนข่มขู่และยับยั้งนวัตกรรม สะท้อนความท้าทายของเทคโนโลยี AI Agent ในวงการอีคอมเมิร์ซ

By