Microsoft เปิดตัวโมเดล AI ใหม่ อาจท้าชิง GPT-4 และ Google Gemini

Microsoft เปิดตัวโมเดล AI ใหม่ อาจท้าชิง GPT-4 และ Google Gemini

Microsoft กำลังพัฒนา AI language model ขนาดใหญ่รุ่นใหม่ที่มีชื่อว่า MAI-1 ซึ่งอาจแข่งขันกับ model ระดับแนวหน้าจาก Google, Anthropic และ OpenAI ตามรายงานของ The Information นี่ถือเป็นครั้งแรกที่ไมโครซอฟท์พัฒนา AI model ขนาดใหญ่ภายในบริษัทเอง นับตั้งแต่ลงทุนกว่า 10,000 ล้านดอลลาร์ใน OpenAI เพื่อสิทธิ์ในการนำ AI models ของ startup มาใช้ซ้ำ GPT-4 ของ OpenAI ไม่เพียงขับเคลื่อน ChatGPT แต่ยังรวมถึง Microsoft Copilot ด้วย

การพัฒนา MAI-1 นำโดย Mustafa Suleyman อดีตผู้นำ AI ของ Google ซึ่งเพิ่งดำรงตำแหน่ง CEO ของ AI startup Inflection ก่อนที่ไมโครซอฟท์จะเข้าซื้อพนักงานส่วนใหญ่และทรัพย์สินทางปัญญาในราคา 650 ล้านดอลลาร์เมื่อเดือนมีนาคม แม้ว่า MAI-1 อาจต่อยอดจากเทคนิคที่นำมาโดยอดีตพนักงาน Inflection แต่มีรายงานว่าเป็น large language model (LLM) ใหม่ทั้งหมด

ตามการยืนยันโดยพนักงานไมโครซอฟท์ 2 คนที่คุ้นเคยกับโครงการนี้ ด้วย parameters ประมาณ 500,000 ล้านตัว MAI-1 จะมีขนาดใหญ่กว่า open source models ก่อนหน้าของไมโครซอฟท์อย่างมาก (เช่น Phi-3 ที่เราเคยกล่าวถึงเมื่อเดือนที่แล้ว) ซึ่งต้องใช้พลังการประมวลผลและข้อมูลสำหรับ training มากขึ้น รายงานระบุว่าสิ่งนี้ทำให้ MAI-1 อยู่ในระดับใกล้เคียงกับ GPT-4 ของ OpenAI ที่มีข่าวลือว่ามี parameters มากกว่า 1 ล้านล้านตัว (ในการกำหนดค่าแบบ mixture-of-experts) และสูงกว่า models ขนาดเล็กกว่าอย่าง Meta และ Mistral ที่มี parameters 70,000 ล้านตัวมาก

การพัฒนา MAI-1 บ่งชี้ถึงแนวทางคู่ขนานด้าน AI ภายในไมโครซอฟท์ ที่มุ่งเน้นทั้ง language models ขนาดเล็กที่รันบนอุปกรณ์พกพาและ models ขนาดใหญ่ระดับแนวหน้าที่ขับเคลื่อนด้วย cloud Apple ก็กำลังสำรวจแนวทางที่คล้ายกัน และยังเน้นให้เห็นถึงความเต็มใจของบริษัทที่จะสำรวจการพัฒนา AI อย่างเป็นอิสระจาก OpenAI ซึ่งเทคโนโลยีปัจจุบันขับเคลื่อนคุณสมบัติ generative AI ที่ทะเยอทะยานที่สุดของไมโครซอฟท์ รวมถึง chatbot ที่ฝังอยู่ใน Windows

มีรายงานว่ายังไม่มีการกำหนดวัตถุประสงค์ที่แน่ชัดของ MAI-1 (แม้แต่ภายในไมโครซอฟท์เอง) และการใช้งานที่เหมาะสมที่สุดจะขึ้นอยู่กับประสิทธิภาพ ตามแหล่งข้อมูลหนึ่งของ The Information ในการ train model ไมโครซอฟท์ได้จัดสรร cluster ขนาดใหญ่ของเซิร์ฟเวอร์ที่มี Nvidia GPUs และรวบรวมข้อมูล training จากแหล่งต่างๆ รวมถึงข้อความที่สร้างโดย GPT-4 ของ OpenAI และข้อมูลสาธารณะจากอินเทอร์เน็ต ขึ้นอยู่กับความคืบหน้าในสัปดาห์ต่อๆ ไป The Information รายงานว่าไมโครซอฟท์อาจแสดงตัวอย่าง MAI-1 ได้ตั้งแต่งานประชุมนักพัฒนา Build ในเดือนนี้

ข้อมูลอ้างอิงจาก New Microsoft AI model may challenge GPT-4 and Google Gemini

Read more

AI Pilots ขยายสู่ระดับ Production ได้สำเร็จได้อย่างไร

news

AI Pilots ขยายสู่ระดับ Production ได้สำเร็จได้อย่างไร

องค์กรที่ได้ ROI สูงจาก AI ล้วนเริ่มจาก Data Foundation ที่แข็งแกร่ง สร้าง Trust วัดผลอย่างเป็นระบบ และรักษา Governance ตลอดวงจร เพื่อผลักดัน AI Pilots สู่ Production ได้สำเร็จ

By
Anthropic เปิดตัว Claude Code Artifacts: เปลี่ยน Terminal ให้เป็น Live Dashboard แชร์ได้ทันที

news

Anthropic เปิดตัว Claude Code Artifacts: เปลี่ยน Terminal ให้เป็น Live Dashboard แชร์ได้ทันที

Anthropic เปิดตัว Claude Code Artifacts ฟีเจอร์ใหม่สำหรับแผน Team และ Enterprise ที่แปลง Terminal Session ให้เป็น Live Interactive Webpage แชร์ได้ทันที พร้อมอัปเดต Real-Time โดยไม่ต้องโหลดซ้ำ

By
วัคซีน 'ครั้งแรกของโลก' ที่ออกแบบโดย Artificial Intelligence

news

วัคซีน 'ครั้งแรกของโลก' ที่ออกแบบโดย Artificial Intelligence

นักวิจัย University of Cambridge ประกาศความสำเร็จครั้งประวัติศาสตร์ ใช้ AI ออกแบบ super-antigen สำหรับวัคซีน coronavirus ครอบคลุมทุกสายพันธุ์ เป็นครั้งแรกของโลก พร้อมต่อยอดสู่วัคซีน Flu, H5N1 และ Ebola

By
AI ไขปริศนาคณิตศาสตร์อายุกว่า 80 ปี สร้างความตื่นตะลึงให้นักคณิตศาสตร์ทั่วโลก

news

AI ไขปริศนาคณิตศาสตร์อายุกว่า 80 ปี สร้างความตื่นตะลึงให้นักคณิตศาสตร์ทั่วโลก

OpenAI เปิดเผยว่า AI สามารถค้นพบ counterexample ของ Erdős conjecture ที่ตั้งไว้ตั้งแต่ปี 1946 โดยใช้ algebraic number theory พิสูจน์ว่า square grid ไม่ใช่ configuration ที่ดีที่สุด นักคณิตศาสตร์ระดับโลกยืนยันผลลัพธ์น่าตีพิมพ์

By