Nvidia เปิดตัวตระกูลโมเดล Nemotron-3 ขับเคลื่อนนวัตกรรม AI แบบโอเพนซอร์ส
Nvidia เปิดตัวตระกูลโมเดล Nemotron-3 แบบโอเพนซอร์ส พร้อมเครื่องมือและข้อมูลสำหรับพัฒนา AI ที่มีประสิทธิภาพสูง รองรับบริบทยาว 1 ล้านโทเค็น และมาพร้อม Reinforcement Learning Gyms เพื่อสร้าง AI เฉพาะทาง
Key takeaway
- Nvidia เปิดตัวตระกูลโมเดล Nemotron-3 เป็นโมเดล AI แบบโอเพนซอร์สที่มีประสิทธิภาพสูง ใช้สถาปัตยกรรมแบบผสมผสาน Mamba-Transformer mixture-of-experts (MoE) มาพร้อมความยาวบริบท 1 ล้านโทเค็น
- Nvidia ระบุความท้าทายสำคัญ 3 ประการสำหรับองค์กรด้าน AI คือ ความต้องการระบบของโมเดลที่หลากหลาย, การเชี่ยวชาญเฉพาะทางสำหรับ "last mile" และต้นทุนของ "long thinking"
- บริษัทเปิดเผยชุดข้อมูลคุณภาพสูง, Reinforcement Learning Gyms และพิมพ์เขียวสำหรับองค์กร เพื่อช่วยให้นักพัฒนาสามารถสร้าง agents ที่แม่นยำและมีความสามารถมากขึ้น
Nvidia Corp. ผู้นำด้านปัญญาประดิษฐ์ประกาศเปิดตัวตระกูลโมเดล Nemotron-3 พร้อมข้อมูลและเครื่องมือต่างๆ แสดงถึงความมุ่งมั่นของบริษัทในการสนับสนุนระบบนิเวศแบบเปิด โดยมุ่งเน้นการส่งมอบโมเดลประสิทธิภาพสูง แม่นยำ และโปร่งใส ซึ่งจำเป็นสำหรับการสร้างแอปพลิเคชัน AI แบบ Agentic ที่ซับซ้อน
Jensen Huang ซีอีโอของ Nvidia กล่าวถึงความสำคัญของโอเพนซอร์สในการทำให้ทุกคนเข้าถึงโมเดล AI เครื่องมือ และซอฟต์แวร์ได้ การประกาศนี้ตอกย้ำความเชื่อของบริษัทว่าโอเพนซอร์สเป็นรากฐานของนวัตกรรม AI ที่ขับเคลื่อนการทำงานร่วมกันทั่วโลกและลดอุปสรรคการเข้าถึงสำหรับนักพัฒนาที่หลากหลาย
การรับมือกับความท้าทายใหม่ในองค์กรด้าน AI
ขณะที่โมเดลภาษาขนาดใหญ่ (LLM) มีความแม่นยำในการให้เหตุผลที่เหมาะสมสำหรับแอปพลิเคชันองค์กร Nvidia ได้เน้นย้ำถึงความท้าทายสำคัญ 3 ประการที่ธุรกิจกำลังเผชิญ:
- ความต้องการระบบของโมเดล: ไม่มีและจะไม่มีโมเดลเดียวที่ตอบโจทย์ทุกอย่าง องค์กรต้องการตัวเลือกของโมเดลเพื่อสร้างแอปพลิเคชัน AI ที่มีประสิทธิภาพ สิ่งจำเป็นคือระบบของโมเดลที่ทำงานร่วมกัน - ขนาดที่แตกต่างกัน, modalities และ orchestrators เพื่อส่งมอบแนวทางแบบหลายโมเดล
- การเชี่ยวชาญเฉพาะทางสำหรับ "last mile": แอปพลิเคชัน AI มักจะ "ชนเพดาน" และต้องมีความเชี่ยวชาญเฉพาะสำหรับโดเมนเฉพาะ เช่น การดูแลสุขภาพ บริการทางการเงิน หรือความปลอดภัยทางไซเบอร์ ซึ่งต้องการการฝึกโมเดลด้วยข้อมูลกรรมสิทธิ์จำนวนมากและความรู้ที่เข้ารหัสโดยผู้เชี่ยวชาญ
- ต้นทุนของ "long thinking": คำตอบที่ฉลาดมากขึ้นต้องการการให้เหตุผลที่ยาวนานขึ้น การสะท้อนตัวเอง และการพิจารณาที่ลึกซึ้งยิ่งขึ้น - กระบวนการที่ Nvidia เรียกว่า "long thinking" ซึ่งเพิ่มการใช้โทเค็นและต้นทุนการคำนวณอย่างมีนัยสำคัญ ทำให้ต้องการสถาปัตยกรรมที่มีประสิทธิภาพในการใช้โทเค็นและกลยุทธ์การอนุมานที่ดีกว่า
Nemotron-3: ตระกูลโมเดลเปิดที่มีประสิทธิภาพสูง
คำตอบของ Nvidia คือตระกูล Nemotron-3 ที่มีจุดเด่นด้านการเป็นโมเดลเปิด แม่นยำ และมีประสิทธิภาพ โมเดลใหม่นี้ใช้สถาปัตยกรรมแบบผสมผสาน Mamba-Transformer mixture-of-experts (MoE) การออกแบบนี้ช่วยเพิ่มประสิทธิภาพอย่างมากโดยทำงานได้เร็วขึ้นหลายเท่าและลดความต้องการหน่วยความจำ
ตระกูล Nemotron-3 จะเปิดตัวใน 3 ขนาด:
- Nemotron-3 Nano (พร้อมใช้งานแล้ว): โมเดลที่มีประสิทธิภาพและแม่นยำสูง แม้จะเป็นโมเดลพารามิเตอร์ 30 พันล้าน แต่มีเพียง 3 พันล้านพารามิเตอร์ที่ทำงานในเวลาใดๆ ทำให้สามารถทำงานบน GPU ขนาดเล็กได้ เช่น L40S
- Nemotron-3 Super (ไตรมาส 1 ปี 2026): ปรับให้เหมาะสมกับ GPU H100 สองตัว จะรวม Latent MoE เพื่อความแม่นยำที่มากขึ้นด้วยการใช้ทรัพยากรการคำนวณเท่าเดิม
- Nemotron-3 Ultra (ครึ่งแรกของปี 2026): ออกแบบมาเพื่อให้ประสิทธิภาพและขนาดสูงสุด
ประสิทธิภาพที่ดีขึ้นและความยาวบริบทที่เพิ่มขึ้น
Nemotron-3 มีความแม่นยำชั้นนำในระดับเดียวกัน ตามที่แสดงในการทดสอบอิสระจากบริษัท Artificial Analysis ในการทดสอบหนึ่ง Nemotron-3 Nano ได้รับการยืนยันว่าเป็นโมเดลที่เปิดและฉลาดที่สุดในระดับ tiny, small reasoning
ข้อได้เปรียบสำคัญของโมเดลมาจากการมุ่งเน้นที่ประสิทธิภาพของโทเค็นและความเร็ว Nvidia เน้นย้ำถึงอัตราส่วน tokens-to-intelligence ซึ่งสำคัญมากเมื่อความต้องการโทเค็นจาก agents ที่ทำงานร่วมกันเพิ่มขึ้น คุณสมบัติเด่นของตระกูลนี้คือความยาวบริบท 1 ล้านโทเค็น หน้าต่างบริบทขนาดใหญ่นี้ช่วยให้โมเดลสามารถประมวลผลการให้เหตุผลที่หนาแน่นและระยะไกลด้วยต้นทุนที่ต่ำลง ทำให้สามารถประมวลผลโค้ดทั้งหมด ข้อกำหนดทางเทคนิคที่ยาว และการสนทนาหลายวันในการผ่านเดียว
Reinforcement Learning Gyms: กุญแจสู่ความเชี่ยวชาญเฉพาะทาง
องค์ประกอบหลักของการเปิดตัว Nemotron-3 คือการใช้สภาพแวดล้อม NeMo Gym และชุดข้อมูลสำหรับ Reinforcement Learning (RL) ซึ่งให้เครื่องมือและโครงสร้างพื้นฐานที่ Nvidia ใช้ในการฝึก Nemotron-3 บริษัทเป็นรายแรกที่เปิดตัวสภาพแวดล้อม RL ที่เปิดเผย ทันสมัย และสมบูรณ์ พร้อมกับโมเดลเปิด ไลบรารี และข้อมูลเพื่อช่วยให้นักพัฒนาสร้าง agents ที่แม่นยำและมีความสามารถมากขึ้น
กรอบการทำงาน RL ช่วยให้นักพัฒนาสามารถเลือกสภาพแวดล้อมและเริ่มสร้างข้อมูลการฝึกเฉพาะทางได้อย่างรวดเร็ว
กระบวนการประกอบด้วย:
- การฝึกโมเดลพื้นฐาน (เริ่มจากกรอบการทำงาน NeMo)
- การฝึกฝน/จำลองในสภาพแวดล้อม "gym" เพื่อสร้างคำตอบหรือทำตามคำแนะนำ
- การให้คะแนน/ตรวจสอบคำตอบกับระบบรางวัล (มนุษย์หรืออัตโนมัติ)
- การอัปเดต/ฝึกซ้ำโมเดลด้วยข้อมูลคุณภาพสูงที่ได้รับการตรวจสอบ เพื่อปรับให้มุ่งไปสู่คำตอบที่ได้คะแนนสูงขึ้น
วงจรที่เป็นระบบนี้ช่วยให้โมเดลพัฒนาในการเลือกการกระทำที่ได้รับรางวัลสูงขึ้น เหมือนนักเรียนที่พัฒนาทักษะผ่านการฝึกฝนซ้ำๆ ภายใต้การแนะนำ Nvidia ได้เปิดตัวสภาพแวดล้อม Gym 12 แห่งที่มุ่งเน้นงานที่มีผลกระทบสูง เช่น การเขียนโค้ดแข่งขัน คณิตศาสตร์ และการจัดตารางปฏิทินที่ใช้งานได้จริง
ความมุ่งมั่นที่ขยายของ Nvidia ต่อโอเพนซอร์ส
การเปิดตัว Nemotron ได้รับการสนับสนุนด้วยความมุ่งมั่นใน 3 ด้าน:
ไลบรารีและการวิจัยแบบเปิด
Nvidia กำลังเปิดเผยโค้ดจริงที่ใช้ในการฝึก Nemotron-3 เพื่อความโปร่งใส รวมถึงงานวิจัยที่อธิบายเทคนิคต่างๆ เช่น การสร้างข้อมูลสังเคราะห์และ RL
นักวิจัยของ Nvidia ยังคงผลักดันขอบเขตของ AI ด้วยงานวิจัยที่โดดเด่น ได้แก่:
- Nemotron Cascade: โมเดลนักเรียนที่มีประสิทธิภาพเหนือกว่าครู (DeepSeek โมเดลพารามิเตอร์ 500-600 พันล้าน) ในการเขียนโค้ด
- RLP (Reinforcement Learning in Pretraining): เทคนิคในการฝึกโมเดลการให้เหตุผลให้คิดด้วยตัวเองตั้งแต่ช่วงแรกของกระบวนการ
ชุดข้อมูลคุณภาพสูง
Nvidia กำลังเปลี่ยนแนวคิดเรื่องข้อมูลจาก big data ไปสู่การจัดการข้อมูลที่ฉลาดและมีคุณภาพที่ดีขึ้น บริษัทกำลังเปิดตัวชุดข้อมูลใหม่หลายชุด:
- ข้อมูล Pre-training: โทเค็นใหม่มากกว่า 3 ล้านล้านของข้อมูล pre-training คุณภาพสูง ที่สร้างขึ้นโดยสังเคราะห์และกรองเพื่อคุณภาพ "all signal, no noise" โดยใช้การคำนวณมากกว่า 1 ล้านชั่วโมงของ H100
- ข้อมูล Post-training (Safe Instruction): ชุดข้อมูล 13 ล้านตัวอย่างที่ใช้เฉพาะผลลัพธ์ของโมเดลที่ได้รับอนุญาต ทำให้ปลอดภัยสำหรับการใช้งานในองค์กร
- ชุดข้อมูล RL: สภาพแวดล้อม reinforcement learning ใหม่ 12 แห่งและชุดข้อมูลที่ครอบคลุม 900,000 ตัวอย่างงานและ prompts
- Nemotron-agent safety: ให้ OpenTelemetry traces ที่ติดป้ายกำกับ 10,800 รายการจากขั้นตอนการทำงานของ agent ที่ใช้เครื่องมือหลายขั้นตอน เพื่อช่วยประเมินและลดความเสี่ยงด้านความปลอดภัย
พิมพ์เขียวสำหรับองค์กรและระบบนิเวศ
Nvidia กำลังให้พิมพ์เขียวอ้างอิงเพื่อเร่งการนำไปใช้ โดยรวมโมเดล Nemotron-3 และไลบรารีเร่งความเร็ว:
- IQ Deep Researcher: สำหรับการสร้างผู้ช่วยวิจัย AI ในองค์กร
- การค้นหาและสรุปวิดีโอ: เปลี่ยนวิดีโอหลายชั่วโมงให้เป็นข้อมูลเชิงลึกในไม่กี่วินาที
- Enterprise RAG: พิมพ์เขียว retrieval-augment generation ที่ได้รับการปรับให้เหมาะสมที่สุดสำหรับองค์กร
ระบบนิเวศ Nemotron มีพันธมิตรสำคัญสนับสนุน เช่น Amazon Bedrock, CrowdStrike Holdings Inc. และ ServiceNow Inc. โดย ServiceNow ระบุว่า 15% ของข้อมูล pretraining สำหรับโมเดล Apriel 1.6 Thinker ของพวกเขามาจากชุดข้อมูล Nemotron ของ Nvidia
อุตสาหกรรมกำลังลดกระแสความนิยมของ AI และเราควรเริ่มเห็นกรณีการใช้งานจริงมากขึ้น ตระกูล Nemotron-3 เหมาะอย่างยิ่งสำหรับยุคนี้เนื่องจากให้พื้นฐานโอเพนซอร์สที่มีประสิทธิภาพสำหรับการพัฒนา Agentic AI รุ่นต่อไป ซึ่งตอกย้ำความมุ่งมั่นของ Nvidia ในการทำให้นวัตกรรม AI เป็นประชาธิปไตย# Nvidia เปิดตัว AI Foundry เพื่อเร่งการพัฒนาโมเดล AI แบบกำหนดเอง
Nvidia ได้เปิดตัวบริการใหม่ภายใต้ชื่อ "AI Foundry" ซึ่งออกแบบมาเพื่อช่วยให้องค์กรต่างๆ สามารถพัฒนาโมเดล AI แบบกำหนดเองได้อย่างรวดเร็วและมีประสิทธิภาพมากขึ้น บริการดังกล่าวถือเป็นส่วนสำคัญในกลยุทธ์ของ Nvidia ที่มุ่งขยายการเข้าถึงเทคโนโลยี AI ให้แพร่หลายในวงกว้าง
AI Foundry จะเป็นเครื่องมือที่ช่วยให้บริษัทต่างๆ สามารถสร้าง ปรับแต่ง และนำโมเดล AI ไปใช้งานให้ตอบโจทย์ความต้องการเฉพาะทางของแต่ละธุรกิจได้อย่างเต็มประสิทธิภาพ โดยได้รับการสนับสนุนจากโครงสร้างพื้นฐานอันทรงพลังและความเชี่ยวชาญระดับสูงของ Nvidia
นักวิเคราะห์จาก ZK Research ได้ให้ความเห็นว่า การเปิดตัวบริการนี้ถือเป็นก้าวสำคัญที่จะช่วยให้องค์กรต่างๆ สามารถใช้ประโยชน์จากเทคโนโลยี AI ได้อย่างเต็มที่ โดยไม่จำเป็นต้องมีทรัพยากรและความเชี่ยวชาญในระดับเดียวกับบริษัทเทคโนโลยียักษ์ใหญ่
ทั้งนี้ บริการใหม่ดังกล่าวสอดคล้องกับวิสัยทัศน์ของ Nvidia ในการสร้างระบบนิเวศ AI แบบครบวงจรที่รองรับความต้องการของทั้งผู้ใช้ระดับองค์กรและนักพัฒนารายย่อยได้อย่างทั่วถึง
Why it matters
💡 ข่าวการเปิดตัวตระกูลโมเดล Nemotron-3 ของ Nvidia เป็นเรื่องที่ผู้สนใจเทคโนโลยี AI ไม่ควรพลาด เพราะแสดงให้เห็นถึงการเปลี่ยนแปลงครั้งสำคัญในวงการ AI โดย Nvidia กำลังผลักดันแนวคิดโอเพนซอร์สที่จะทำให้เทคโนโลยี AI เข้าถึงได้ง่ายขึ้นสำหรับทุกคน ไม่ใช่แค่บริษัทยักษ์ใหญ่เท่านั้น นอกจากนี้ ความสามารถของโมเดลในการรองรับบริบทยาวถึง 1 ล้านโทเค็นและประสิทธิภาพที่เพิ่มขึ้นจะเปิดโอกาสใหม่ๆ สำหรับการพัฒนาแอปพลิเคชัน AI ที่ซับซ้อนและชาญฉลาดยิ่งขึ้น
ข้อมูลอ้างอิงจาก https://siliconangle.com/2025/12/16/analysis-nvidia-nemotron-3-open-models-lead-efficient-agentic-ai/