Gemini 1.5 Pro เปิดให้บริการแล้วกว่า 180 ประเทศ พร้อมฟีเจอร์ใหม่พร้อมให้ลองใช้งาน

เมื่อไม่ถึงสองเดือนที่ผ่านมา เราได้เปิดตัว Gemini 1.5 Pro รุ่นใหม่ล่าสุดใน Google AI Studio ให้นักพัฒนาได้ทดลองใช้งาน เรารู้สึกทึ่งกับสิ่งที่ community สามารถ debug สร้างสรรค์ และเรียนรู้โดยใช้ context window ขนาด 1 ล้านที่ล้ำสมัยของเรา

Gemini 1.5 Pro เปิดให้บริการแล้วกว่า 180 ประเทศ พร้อมฟีเจอร์ใหม่พร้อมให้ลองใช้งาน

วันนี้ เรากำลังเปิดให้ใช้งาน Gemini 1.5 Pro ใน 180+ ประเทศผ่าน Gemini API แบบ Public Preview พร้อม Native Audio (Speech) Understanding ครั้งแรก และ File API ใหม่เพื่อให้ง่ายต่อการจัดการไฟล์ นอกจากนี้ เรายังเปิดตัว Features ใหม่ๆ เช่น System Instructions และ JSON Mode เพื่อให้นักพัฒนาสามารถควบคุม Output ของ Model ได้มากขึ้น และท้ายที่สุด เรากำลังปล่อย Text Embedding Model รุ่นใหม่ล่าสุดที่มีประสิทธิภาพเหนือกว่า Model ที่ใกล้เคียงกัน ไปที่ Google AI Studio เพื่อสร้างหรือเข้าถึง API key ของคุณ แล้วเริ่มสร้างสรรค์ได้เลย

เปิดโลกแห่งการใช้งานใหม่ๆ ด้วย Modalities ประเภทเสียงและวิดีโอ

เรากำลังขยายความสามารถในการรับข้อมูลนำเข้า (Input Modalities) สำหรับ Gemini 1.5 Pro ให้รวมถึงความเข้าใจเสียงพูด (Speech Understanding) ทั้งใน Gemini API และ Google AI Studio นอกจากนี้ Gemini 1.5 Pro ยังสามารถใช้การเหตุผล (Reasoning) ข้ามระหว่างภาพ (Frames) และเสียง (Speech) สำหรับวิดีโอที่อัปโหลดใน Google AI Studio และเรารอคอยที่จะเพิ่มการสนับสนุน API สำหรับฟีเจอร์นี้ในเร็วๆ นี้

การปรับปรุง Gemini API

วันนี้ เราได้ตอบสนองต่อคำร้องขอจากนักพัฒนาซอฟต์แวร์ชั้นนำหลายประการ ดังนี้

  1. System Instructions: ชี้นำการตอบสนองของโมเดลด้วยคำสั่งระบบ (System Instructions) ซึ่งตอนนี้มีให้ใช้งานใน Google AI Studio และ Gemini API แล้ว คุณสามารถกำหนดบทบาท (Roles) รูปแบบ (Formats) เป้าหมาย (Goals) และกฎ (Rules) เพื่อกำกับพฤติกรรมของโมเดลให้เหมาะสมกับการใช้งานเฉพาะด้านของคุณ
  2. JSON Mode: สั่งให้โมเดลส่งเอาต์พุตเป็น JSON objects เท่านั้น โหมดนี้ช่วยให้สกัดข้อมูลที่มีโครงสร้าง (Structured Data) จากข้อความหรือรูปภาพได้ คุณสามารถเริ่มต้นใช้งานผ่าน cURL ได้ทันที และเร็วๆ นี้จะรองรับ Python SDK ด้วย
  3. การปรับปรุงการเรียกใช้ฟังก์ชัน (Function Calling): ตอนนี้คุณสามารถเลือกโหมดเพื่อจำกัดเอาต์พุตของโมเดลได้แล้ว ช่วยเพิ่มความน่าเชื่อถือ โดยเลือกได้ระหว่าง ข้อความ (Text), การเรียกฟังก์ชัน (Function call) หรือตัวฟังก์ชันเองโดยตรง

แบบจำลอง Embedding รุ่นใหม่ที่มีประสิทธิภาพดียิ่งขึ้น

นักพัฒนาซอฟต์แวร์สามารถเข้าถึงแบบจำลอง Text Embedding รุ่นใหม่ล่าสุดของเราผ่าน Gemini API ได้แล้ววันนี้ แบบจำลอง text-embedding-004 (หรือ text-embedding-preview-0409 ใน Vertex AI) มีประสิทธิภาพในการค้นคืนข้อมูล (Retrieval Performance) ที่แข็งแกร่งขึ้น และทำงานได้ดีกว่าแบบจำลองที่มีอยู่เดิมที่มีมิติใกล้เคียงกัน เมื่อทดสอบบน MTEB Benchmarks

นี่เป็นเพียงการปรับปรุงครั้งแรกจากอีกหลายๆ อย่างที่จะมาถึง Gemini API และ Google AI Studio ในอีกไม่กี่สัปดาห์ข้างหน้า เรายังคงมุ่งมั่นที่จะทำให้ Google AI Studio และ Gemini API เป็นวิธีที่ง่ายที่สุดในการสร้างสรรค์นวัตกรรมด้วย Gemini

ข้อมูลอ้างอิงจาก: Gemini 1.5 Pro Now Available in 180+ Countries; with Native Audio Understanding, System Instructions, JSON Mode and more

Read more

กล้องอัจฉริยะด้วย AI ของ Logitech ปฏิวัติการแสดงผลห้องประชุมขนาดใหญ่ในการประชุมวิดีโอ

news

กล้องอัจฉริยะด้วย AI ของ Logitech ปฏิวัติการแสดงผลห้องประชุมขนาดใหญ่ในการประชุมวิดีโอ

Logitech นำเสนอโซลูชันใหม่ด้วย Rally AI Camera และ Rally AI Camera Pro ที่ใช้เทคโนโลยี AI ช่วยแก้ปัญหาการประชุมในห้องขนาดใหญ่ ด้วยระบบจัดเฟรมอัจฉริยะ RightSight 2 ที่ปรับมุมมองตามสถานการณ์ เพื่อให้การประชุมแบบไฮบริดมีความเท่าเทียมมากขึ้น

By
Resolve AI ระดมทุน $125 ล้านด้วยมูลค่า $1 พันล้าน เพื่อพัฒนาระบบบำรุงรักษาแอปพลิเคชันอัตโนมัติ

news

Resolve AI ระดมทุน $125 ล้านด้วยมูลค่า $1 พันล้าน เพื่อพัฒนาระบบบำรุงรักษาแอปพลิเคชันอัตโนมัติ

Resolve AI สตาร์ทอัพที่พัฒนาแพลตฟอร์มแก้ไขปัญหาแอปพลิเคชันอัตโนมัติ ระดมทุน Series A มูลค่า $125 ล้าน จาก Lightspeed และพันธมิตร ส่งผลให้บริษัทมีมูลค่า $1 พันล้าน เงินทุนจะถูกใช้ขยายทีมและพัฒนาโมเดล AI แบบกำหนดเอง

By
นักวิจัยเผยผู้บุกรุก AWS ได้รับสิทธิ์ admin ภายในเวลาไม่ถึง 10 นาที ด้วยความช่วยเหลือจาก AI

news

นักวิจัยเผยผู้บุกรุก AWS ได้รับสิทธิ์ admin ภายในเวลาไม่ถึง 10 นาที ด้วยความช่วยเหลือจาก AI

ผู้บุกรุกใช้ AI เจาะระบบคลาวด์ AWS ได้สิทธิ์แอดมินภายในเวลาไม่ถึง 10 นาที โดยขโมย credentials จาก S3 buckets สาธารณะ ยกระดับสิทธิ์ผ่าน Lambda function และเข้าถึงทรัพยากร AI ของเหยื่อ กรณีนี้แสดงให้เห็นถึงภัยคุกคามใหม่ที่ใช้ AI ช่วยโจมตี

By
จาก Clawdbot สู่ Moltbot: AI Agent นี้ไวรัลและเปลี่ยนตัวตนใหม่ภายใน 72 ชั่วโมงได้อย่างไร

news

จาก Clawdbot สู่ Moltbot: AI Agent นี้ไวรัลและเปลี่ยนตัวตนใหม่ภายใน 72 ชั่วโมงได้อย่างไร

ติดตามเรื่องราวของ Moltbot ผู้ช่วย AI โอเพนซอร์สที่ต้องเปลี่ยนชื่อจาก Clawdbot หลังปัญหาเครื่องหมายการค้ากับ Anthropic เจ้าของ Claude AI พร้อมเรียนรู้คุณสมบัติเด่นที่ทำให้ผู้ช่วย AI นี้น่าสนใจ ทั้งหน่วยความจำถาวร การแจ้งเตือนเชิงรุก และความสามารถในการทำงานอัตโนมัติ

By