Google เปิดตัว Gemini 2.5 Flash โมเดล AI ที่มีประสิทธิภาพด้านต้นทุนสูงสุด

Google เปิดตัว Gemini 2.5 Flash โมเดล AI รุ่นใหม่ที่มาพร้อมความสามารถในการให้เหตุผลขั้นสูง รองรับอินพุตหลากหลายรูปแบบ และมีประสิทธิภาพด้านต้นทุนสูงสุด พร้อมให้ทดลองใช้งานแล้วผ่าน API

Google เปิดตัว Gemini 2.5 Flash โมเดล AI ที่มีประสิทธิภาพด้านต้นทุนสูงสุด

Key takeaway

  • Gemini 2.5 Flash เป็นโมเดล AI รุ่นใหม่ล่าสุดจาก Google ที่มีจุดเด่นด้านประสิทธิภาพต้นทุนสูงสุด โดยนักพัฒนาสามารถกำหนด "งบประมาณการคิด" เพื่อควบคุมค่าใช้จ่ายได้ตามความเหมาะสมของงาน
  • โมเดลใหม่นี้มาพร้อมความสามารถในการรับอินพุตได้หลากหลายรูปแบบ (ข้อความ รูปภาพ วิดีโอ เสียง) พร้อม context window ขนาด 1 ล้าน token และข้อมูลความรู้ที่อัปเดตถึงต้นปี 2025
  • ในด้านประสิทธิภาพ Gemini 2.5 Flash ทำคะแนนได้ 12% ใน Humanity's Last Exam ซึ่งสูงกว่าคู่แข่งหลายราย แต่ยังต่ำกว่า o4-mini ของ OpenAI ที่ทำได้ 14% โดยสามารถทดลองใช้งานได้แล้วผ่าน Gemini API, AI Studio และ Vertex AI

เพียงไม่กี่สัปดาห์หลังจากเปิดตัว Gemini 2.5 Pro Google ได้ก้าวไปอีกขั้นด้วยการเปิดตัวโมเดล AI ประสิทธิภาพสูงรุ่นใหม่ล่าสุด

เมื่อวันพฤหัสบดีที่ผ่านมา บริษัทได้เปิดตัว "เวอร์ชันเบื้องต้น" ของ Gemini 2.5 Flash ในรูปแบบพรีวิวผ่าน Gemini API, AI Studio และ Vertex AI โมเดลใหม่นี้มาพร้อมข้อมูลความรู้ที่อัปเดตถึงเดือนมกราคม 2025 สามารถรับอินพุตได้หลากหลายทั้งข้อความ รูปภาพ วิดีโอ และเสียง พร้อมรองรับ context window ขนาดใหญ่ถึงหนึ่งล้าน token

Google ระบุว่า Gemini 2.5 Flash พัฒนาต่อยอดจาก Flash 2.0 ด้วยความสามารถในการให้เหตุผล (reasoning) ที่เหนือกว่า "โดยไม่สูญเสียความเร็วหรือข้อได้เปรียบด้านต้นทุนที่เป็นจุดเด่น" โมเดลที่เน้นการให้เหตุผลจะใช้เวลา "คิด" หรือวิเคราะห์คำถามอย่างละเอียดก่อนตอบสนอง ทำให้ได้ผลลัพธ์ที่แม่นยำและตรงประเด็นมากขึ้น ตอบสนองความต้องการของผู้ใช้ได้ดีกว่าโมเดลรุ่นก่อนที่เน้นความเร็วเป็นหลัก นอกจากนี้ ยังสามารถจัดการกับปัญหาหรืองานที่มีความซับซ้อนหลายขั้นตอนได้อย่างมีประสิทธิภาพมากขึ้น

"Gemini 2.5 Flash มีประสิทธิภาพสูงใน Hard Prompts บน ChatBot Arena รองจาก 2.5 Pro เท่านั้น" Google ระบุในประกาศอย่างภาคภูมิใจ

Google นำเสนอโมเดลใหม่นี้ว่าเป็นโมเดล AI ที่มีประสิทธิภาพด้านต้นทุนสูงสุด โดย 2.5 Flash "ช่วยให้นักพัฒนาสามารถกำหนดปริมาณการคิดเพื่อเพิ่มประสิทธิภาพสูงสุด" นักพัฒนาจะมี "งบประมาณการคิด" หรืออำนาจในการเลือกจ่ายเงินสำหรับการให้เหตุผลเฉพาะเมื่อจำเป็นเท่านั้น โดยเมื่อเปิดใช้การให้เหตุผล ราคาจะเพิ่มจาก 60 เซนต์ต่อหนึ่งล้าน token เป็น $3.50

หากนักพัฒนาไม่ได้กำหนดงบประมาณไว้ โมเดลจะประเมินความต้องการในการคิดด้วยตัวเอง โดยวิเคราะห์จากความซับซ้อนของคำขอ เช่น สามารถแยกแยะคำถามง่ายๆ อย่าง "สหรัฐอเมริกามีกี่รัฐ?" ออกจากโจทย์คณิตศาสตร์ที่มีหลายขั้นตอน ทั้งนี้ Google แนะนำว่า หากต้องการความเร็วและต้นทุนในระดับเดียวกับ Flash 2.0 นักพัฒนาควรตั้งงบประมาณเป็น 0

ในด้านประสิทธิภาพ Gemini 2.5 Flash ทำคะแนนได้ 12% ใน Humanity's Last Exam (HLE) ซึ่งเป็นเกณฑ์ทดสอบทางเลือกใหม่สำหรับวงการ AI ที่การทดสอบแบบเดิมกลายเป็นเรื่องง่ายเกินไปสำหรับโมเดลที่พัฒนาอย่างรวดเร็ว คะแนนนี้สูงกว่าโมเดลคู่แข่งอย่าง Claude 3.7 Sonnet และ DeepSeek R1 แต่ยังน้อยกว่า o4-mini ของ OpenAI ที่เพิ่งเปิดตัวซึ่งทำได้ 14% ในการทดสอบนี้

ผู้สนใจสามารถทดลองใช้ Gemini 2.5 Flash ในรูปแบบพรีวิวได้แล้วผ่าน Gemini API ใน Google AI Studio และ Vertex AI

Why it matters

💡 ข่าวนี้น่าสนใจและสำคัญสำหรับผู้ที่ทำงานในวงการเทคโนโลยีและผู้ที่สนใจด้าน AI เพราะเป็นการเปิดตัวโมเดล AI รุ่นใหม่ล่าสุดจาก Google ที่มาพร้อมความสามารถในการให้เหตุผลที่ดีขึ้น แต่ยังคงรักษาประสิทธิภาพด้านต้นทุนไว้ได้ ที่สำคัญคือระบบ "งบประมาณการคิด" ที่ช่วยให้นักพัฒนาสามารถควบคุมค่าใช้จ่ายได้อย่างมีประสิทธิภาพ ซึ่งถือเป็นนวัตกรรมที่น่าจับตามองในวงการ AI

ข้อมูลอ้างอิงจาก https://www.zdnet.com/article/google-reveals-gemini-2-5-flash-its-most-cost-efficient-thinking-model/

Read more

นโยบายจำกัดการเข้าเมืองของทรัมป์จะทำให้แรงงาน 2.4 ล้านคนหายไป แต่เขาเชื่อว่า AI จะช่วยทดแทนได้

news

นโยบายจำกัดการเข้าเมืองของทรัมป์จะทำให้แรงงาน 2.4 ล้านคนหายไป แต่เขาเชื่อว่า AI จะช่วยทดแทนได้

นโยบายจำกัดการเข้าเมืองของทรัมป์จะทำให้แรงงานสหรัฐฯ ลดลง 2.4 ล้านคนภายในปี 2035 ขณะที่รัฐบาลหวังพึ่ง AI ช่วยรักษาผลิตภาพ แต่นักวิเคราะห์เตือนว่าเทคโนโลยีอาจไม่สามารถชดเชยการขาดแคลนแรงงานและการสูญเสียรายได้ภาษีได้ทั้งหมด

By
Marriott 'กำลังลงทุนอย่างจริงจัง' ในด้าน AI รายงานความคืบหน้าในการย้ายระบบ

news

Marriott 'กำลังลงทุนอย่างจริงจัง' ในด้าน AI รายงานความคืบหน้าในการย้ายระบบ

Marriott กำลังลงทุนอย่างจริงจังในเทคโนโลยี AI โดยทุ่มงบกว่า 1.1 พันล้านดอลลาร์ เพื่อปรับปรุงระบบเทคโนโลยีหลัก 3 ระบบ ได้แก่ ระบบการปรับปรุงส่วนกลาง ระบบบริหารจัดการทรัพย์สิน และแพลตฟอร์มโปรแกรมความภักดี

By
Anthropic's Claude เพิ่มฟีเจอร์ฟรีมากขึ้น ขณะที่ OpenAI เริ่มแสดงโฆษณาใน ChatGPT

news

Anthropic's Claude เพิ่มฟีเจอร์ฟรีมากขึ้น ขณะที่ OpenAI เริ่มแสดงโฆษณาใน ChatGPT

แอนโทรปิคประกาศให้ผู้ใช้ Claude แบบฟรีเข้าถึงฟีเจอร์การสร้างไฟล์, connectors และ skills ได้แล้ว หลังจาก OpenAI เริ่มแสดงโฆษณาใน ChatGPT สำหรับผู้ใช้ฟรีและแผน Go ซึ่งเป็นความพยายามดึงดูดผู้ใช้ที่ไม่ต้องการเห็นโฆษณาขณะใช้แชทบอท

By
Olix สตาร์ทอัพชิป AI โฟโทนิกได้รับเงินลงทุน 220 ล้านดอลลาร์

news

Olix สตาร์ทอัพชิป AI โฟโทนิกได้รับเงินลงทุน 220 ล้านดอลลาร์

สตาร์ทอัพ Olix Computing ผู้พัฒนาชิปเอไอที่ใช้เทคโนโลยีโฟโทนิกประสบความสำเร็จในการระดมทุน 220 ล้านดอลลาร์ นำโดย Hummingbird Ventures ชิป OTPU ของบริษัทแก้ปัญหา "memory wall" ด้วยสถาปัตยกรรมหน่วยความจำแบบใหม่ที่ใช้ SRAM แทน HBM

By