Microsoft เปิดตัวโมเดล AI ใหม่ อาจท้าชิง GPT-4 และ Google Gemini

Microsoft เปิดตัวโมเดล AI ใหม่ อาจท้าชิง GPT-4 และ Google Gemini

Microsoft กำลังพัฒนา AI language model ขนาดใหญ่รุ่นใหม่ที่มีชื่อว่า MAI-1 ซึ่งอาจแข่งขันกับ model ระดับแนวหน้าจาก Google, Anthropic และ OpenAI ตามรายงานของ The Information นี่ถือเป็นครั้งแรกที่ไมโครซอฟท์พัฒนา AI model ขนาดใหญ่ภายในบริษัทเอง นับตั้งแต่ลงทุนกว่า 10,000 ล้านดอลลาร์ใน OpenAI เพื่อสิทธิ์ในการนำ AI models ของ startup มาใช้ซ้ำ GPT-4 ของ OpenAI ไม่เพียงขับเคลื่อน ChatGPT แต่ยังรวมถึง Microsoft Copilot ด้วย

การพัฒนา MAI-1 นำโดย Mustafa Suleyman อดีตผู้นำ AI ของ Google ซึ่งเพิ่งดำรงตำแหน่ง CEO ของ AI startup Inflection ก่อนที่ไมโครซอฟท์จะเข้าซื้อพนักงานส่วนใหญ่และทรัพย์สินทางปัญญาในราคา 650 ล้านดอลลาร์เมื่อเดือนมีนาคม แม้ว่า MAI-1 อาจต่อยอดจากเทคนิคที่นำมาโดยอดีตพนักงาน Inflection แต่มีรายงานว่าเป็น large language model (LLM) ใหม่ทั้งหมด

ตามการยืนยันโดยพนักงานไมโครซอฟท์ 2 คนที่คุ้นเคยกับโครงการนี้ ด้วย parameters ประมาณ 500,000 ล้านตัว MAI-1 จะมีขนาดใหญ่กว่า open source models ก่อนหน้าของไมโครซอฟท์อย่างมาก (เช่น Phi-3 ที่เราเคยกล่าวถึงเมื่อเดือนที่แล้ว) ซึ่งต้องใช้พลังการประมวลผลและข้อมูลสำหรับ training มากขึ้น รายงานระบุว่าสิ่งนี้ทำให้ MAI-1 อยู่ในระดับใกล้เคียงกับ GPT-4 ของ OpenAI ที่มีข่าวลือว่ามี parameters มากกว่า 1 ล้านล้านตัว (ในการกำหนดค่าแบบ mixture-of-experts) และสูงกว่า models ขนาดเล็กกว่าอย่าง Meta และ Mistral ที่มี parameters 70,000 ล้านตัวมาก

การพัฒนา MAI-1 บ่งชี้ถึงแนวทางคู่ขนานด้าน AI ภายในไมโครซอฟท์ ที่มุ่งเน้นทั้ง language models ขนาดเล็กที่รันบนอุปกรณ์พกพาและ models ขนาดใหญ่ระดับแนวหน้าที่ขับเคลื่อนด้วย cloud Apple ก็กำลังสำรวจแนวทางที่คล้ายกัน และยังเน้นให้เห็นถึงความเต็มใจของบริษัทที่จะสำรวจการพัฒนา AI อย่างเป็นอิสระจาก OpenAI ซึ่งเทคโนโลยีปัจจุบันขับเคลื่อนคุณสมบัติ generative AI ที่ทะเยอทะยานที่สุดของไมโครซอฟท์ รวมถึง chatbot ที่ฝังอยู่ใน Windows

มีรายงานว่ายังไม่มีการกำหนดวัตถุประสงค์ที่แน่ชัดของ MAI-1 (แม้แต่ภายในไมโครซอฟท์เอง) และการใช้งานที่เหมาะสมที่สุดจะขึ้นอยู่กับประสิทธิภาพ ตามแหล่งข้อมูลหนึ่งของ The Information ในการ train model ไมโครซอฟท์ได้จัดสรร cluster ขนาดใหญ่ของเซิร์ฟเวอร์ที่มี Nvidia GPUs และรวบรวมข้อมูล training จากแหล่งต่างๆ รวมถึงข้อความที่สร้างโดย GPT-4 ของ OpenAI และข้อมูลสาธารณะจากอินเทอร์เน็ต ขึ้นอยู่กับความคืบหน้าในสัปดาห์ต่อๆ ไป The Information รายงานว่าไมโครซอฟท์อาจแสดงตัวอย่าง MAI-1 ได้ตั้งแต่งานประชุมนักพัฒนา Build ในเดือนนี้

ข้อมูลอ้างอิงจาก New Microsoft AI model may challenge GPT-4 and Google Gemini

Read more

AI ในสงคราม: คดีฟ้อง Data Center ของ xAI จุดชนวนถกเถียงด้านความมั่นคงแห่งชาติสหรัฐฯ

news

AI ในสงคราม: คดีฟ้อง Data Center ของ xAI จุดชนวนถกเถียงด้านความมั่นคงแห่งชาติสหรัฐฯ

รัฐบาล Trump เข้าแทรกแซงคดีฟ้อง xAI ของ Elon Musk ชี้ว่า Data Center ใน Memphis มีความสำคัญต่อความมั่นคงแห่งชาติ หลัง NAACP ฟ้องละเมิด Clean Air Act โดย Grok AI ถูกนำไปใช้ในปฏิบัติการทางทหาร

By
Anthropic: สหรัฐฯ ยกเลิกการควบคุมการส่งออก AI models Fable และ Mythos หลังความกังวลด้านความเสี่ยงด้านความปลอดภัย

news

Anthropic: สหรัฐฯ ยกเลิกการควบคุมการส่งออก AI models Fable และ Mythos หลังความกังวลด้านความเสี่ยงด้านความปลอดภัย

กระทรวงพาณิชย์สหรัฐฯ ยกเลิก Export Controls บน AI Models Fable และ Mythos ของ Anthropic หลังบริษัทให้คำมั่นด้านความปลอดภัย ท่ามกลางเสียงวิจารณ์จากอุตสาหกรรม AI เกี่ยวกับการกำกับดูแลของรัฐบาล

By
ต้นทุนที่ซ่อนอยู่ของ AI Coding: เมื่อเทคโนโลยีสร้างภาวะอัมพาตในที่ทำงาน

news

ต้นทุนที่ซ่อนอยู่ของ AI Coding: เมื่อเทคโนโลยีสร้างภาวะอัมพาตในที่ทำงาน

AI Coding Tool ที่เติบโตเร็วขึ้นทุกปีกำลังสร้างภาวะอัมพาตในที่ทำงาน Software Engineer ทั่วโลกเผชิญความวิตกกังวล สูญเสีย Agency และตั้งคำถามถึงคุณค่าของทักษะที่ฝึกฝนมาหลายปี

By
AI ถอดรหัสม้วนคัมภีร์ Herculaneum อายุ 2,000 ปี ได้สมบูรณ์เป็นครั้งแรกในประวัติศาสตร์

news

AI ถอดรหัสม้วนคัมภีร์ Herculaneum อายุ 2,000 ปี ได้สมบูรณ์เป็นครั้งแรกในประวัติศาสตร์

AI และเทคโนโลยี Virtual Unwrapping ถอดรหัสม้วนคัมภีร์ Herculaneum อายุ 2,000 ปีสำเร็จเป็นครั้งแรกในประวัติศาสตร์ เผยข้อความปรัชญาโบราณกว่า 140 Columns โดยไม่ทำลายต้นฉบับ

By