Nvidia เปิดตัวตระกูลโมเดล Nemotron-3 ขับเคลื่อนนวัตกรรม AI แบบโอเพนซอร์ส

Nvidia เปิดตัวตระกูลโมเดล Nemotron-3 แบบโอเพนซอร์ส พร้อมเครื่องมือและข้อมูลสำหรับพัฒนา AI ที่มีประสิทธิภาพสูง รองรับบริบทยาว 1 ล้านโทเค็น และมาพร้อม Reinforcement Learning Gyms เพื่อสร้าง AI เฉพาะทาง

Nvidia เปิดตัวตระกูลโมเดล Nemotron-3 ขับเคลื่อนนวัตกรรม AI แบบโอเพนซอร์ส

Key takeaway

  • Nvidia เปิดตัวตระกูลโมเดล Nemotron-3 เป็นโมเดล AI แบบโอเพนซอร์สที่มีประสิทธิภาพสูง ใช้สถาปัตยกรรมแบบผสมผสาน Mamba-Transformer mixture-of-experts (MoE) มาพร้อมความยาวบริบท 1 ล้านโทเค็น
  • Nvidia ระบุความท้าทายสำคัญ 3 ประการสำหรับองค์กรด้าน AI คือ ความต้องการระบบของโมเดลที่หลากหลาย, การเชี่ยวชาญเฉพาะทางสำหรับ "last mile" และต้นทุนของ "long thinking"
  • บริษัทเปิดเผยชุดข้อมูลคุณภาพสูง, Reinforcement Learning Gyms และพิมพ์เขียวสำหรับองค์กร เพื่อช่วยให้นักพัฒนาสามารถสร้าง agents ที่แม่นยำและมีความสามารถมากขึ้น

Nvidia Corp. ผู้นำด้านปัญญาประดิษฐ์ประกาศเปิดตัวตระกูลโมเดล Nemotron-3 พร้อมข้อมูลและเครื่องมือต่างๆ แสดงถึงความมุ่งมั่นของบริษัทในการสนับสนุนระบบนิเวศแบบเปิด โดยมุ่งเน้นการส่งมอบโมเดลประสิทธิภาพสูง แม่นยำ และโปร่งใส ซึ่งจำเป็นสำหรับการสร้างแอปพลิเคชัน AI แบบ Agentic ที่ซับซ้อน

Jensen Huang ซีอีโอของ Nvidia กล่าวถึงความสำคัญของโอเพนซอร์สในการทำให้ทุกคนเข้าถึงโมเดล AI เครื่องมือ และซอฟต์แวร์ได้ การประกาศนี้ตอกย้ำความเชื่อของบริษัทว่าโอเพนซอร์สเป็นรากฐานของนวัตกรรม AI ที่ขับเคลื่อนการทำงานร่วมกันทั่วโลกและลดอุปสรรคการเข้าถึงสำหรับนักพัฒนาที่หลากหลาย

การรับมือกับความท้าทายใหม่ในองค์กรด้าน AI

ขณะที่โมเดลภาษาขนาดใหญ่ (LLM) มีความแม่นยำในการให้เหตุผลที่เหมาะสมสำหรับแอปพลิเคชันองค์กร Nvidia ได้เน้นย้ำถึงความท้าทายสำคัญ 3 ประการที่ธุรกิจกำลังเผชิญ:

  1. ความต้องการระบบของโมเดล: ไม่มีและจะไม่มีโมเดลเดียวที่ตอบโจทย์ทุกอย่าง องค์กรต้องการตัวเลือกของโมเดลเพื่อสร้างแอปพลิเคชัน AI ที่มีประสิทธิภาพ สิ่งจำเป็นคือระบบของโมเดลที่ทำงานร่วมกัน - ขนาดที่แตกต่างกัน, modalities และ orchestrators เพื่อส่งมอบแนวทางแบบหลายโมเดล
  2. การเชี่ยวชาญเฉพาะทางสำหรับ "last mile": แอปพลิเคชัน AI มักจะ "ชนเพดาน" และต้องมีความเชี่ยวชาญเฉพาะสำหรับโดเมนเฉพาะ เช่น การดูแลสุขภาพ บริการทางการเงิน หรือความปลอดภัยทางไซเบอร์ ซึ่งต้องการการฝึกโมเดลด้วยข้อมูลกรรมสิทธิ์จำนวนมากและความรู้ที่เข้ารหัสโดยผู้เชี่ยวชาญ
  3. ต้นทุนของ "long thinking": คำตอบที่ฉลาดมากขึ้นต้องการการให้เหตุผลที่ยาวนานขึ้น การสะท้อนตัวเอง และการพิจารณาที่ลึกซึ้งยิ่งขึ้น - กระบวนการที่ Nvidia เรียกว่า "long thinking" ซึ่งเพิ่มการใช้โทเค็นและต้นทุนการคำนวณอย่างมีนัยสำคัญ ทำให้ต้องการสถาปัตยกรรมที่มีประสิทธิภาพในการใช้โทเค็นและกลยุทธ์การอนุมานที่ดีกว่า

Nemotron-3: ตระกูลโมเดลเปิดที่มีประสิทธิภาพสูง

คำตอบของ Nvidia คือตระกูล Nemotron-3 ที่มีจุดเด่นด้านการเป็นโมเดลเปิด แม่นยำ และมีประสิทธิภาพ โมเดลใหม่นี้ใช้สถาปัตยกรรมแบบผสมผสาน Mamba-Transformer mixture-of-experts (MoE) การออกแบบนี้ช่วยเพิ่มประสิทธิภาพอย่างมากโดยทำงานได้เร็วขึ้นหลายเท่าและลดความต้องการหน่วยความจำ

ตระกูล Nemotron-3 จะเปิดตัวใน 3 ขนาด:

  • Nemotron-3 Nano (พร้อมใช้งานแล้ว): โมเดลที่มีประสิทธิภาพและแม่นยำสูง แม้จะเป็นโมเดลพารามิเตอร์ 30 พันล้าน แต่มีเพียง 3 พันล้านพารามิเตอร์ที่ทำงานในเวลาใดๆ ทำให้สามารถทำงานบน GPU ขนาดเล็กได้ เช่น L40S
  • Nemotron-3 Super (ไตรมาส 1 ปี 2026): ปรับให้เหมาะสมกับ GPU H100 สองตัว จะรวม Latent MoE เพื่อความแม่นยำที่มากขึ้นด้วยการใช้ทรัพยากรการคำนวณเท่าเดิม
  • Nemotron-3 Ultra (ครึ่งแรกของปี 2026): ออกแบบมาเพื่อให้ประสิทธิภาพและขนาดสูงสุด

ประสิทธิภาพที่ดีขึ้นและความยาวบริบทที่เพิ่มขึ้น

Nemotron-3 มีความแม่นยำชั้นนำในระดับเดียวกัน ตามที่แสดงในการทดสอบอิสระจากบริษัท Artificial Analysis ในการทดสอบหนึ่ง Nemotron-3 Nano ได้รับการยืนยันว่าเป็นโมเดลที่เปิดและฉลาดที่สุดในระดับ tiny, small reasoning

ข้อได้เปรียบสำคัญของโมเดลมาจากการมุ่งเน้นที่ประสิทธิภาพของโทเค็นและความเร็ว Nvidia เน้นย้ำถึงอัตราส่วน tokens-to-intelligence ซึ่งสำคัญมากเมื่อความต้องการโทเค็นจาก agents ที่ทำงานร่วมกันเพิ่มขึ้น คุณสมบัติเด่นของตระกูลนี้คือความยาวบริบท 1 ล้านโทเค็น หน้าต่างบริบทขนาดใหญ่นี้ช่วยให้โมเดลสามารถประมวลผลการให้เหตุผลที่หนาแน่นและระยะไกลด้วยต้นทุนที่ต่ำลง ทำให้สามารถประมวลผลโค้ดทั้งหมด ข้อกำหนดทางเทคนิคที่ยาว และการสนทนาหลายวันในการผ่านเดียว

Reinforcement Learning Gyms: กุญแจสู่ความเชี่ยวชาญเฉพาะทาง

องค์ประกอบหลักของการเปิดตัว Nemotron-3 คือการใช้สภาพแวดล้อม NeMo Gym และชุดข้อมูลสำหรับ Reinforcement Learning (RL) ซึ่งให้เครื่องมือและโครงสร้างพื้นฐานที่ Nvidia ใช้ในการฝึก Nemotron-3 บริษัทเป็นรายแรกที่เปิดตัวสภาพแวดล้อม RL ที่เปิดเผย ทันสมัย และสมบูรณ์ พร้อมกับโมเดลเปิด ไลบรารี และข้อมูลเพื่อช่วยให้นักพัฒนาสร้าง agents ที่แม่นยำและมีความสามารถมากขึ้น

กรอบการทำงาน RL ช่วยให้นักพัฒนาสามารถเลือกสภาพแวดล้อมและเริ่มสร้างข้อมูลการฝึกเฉพาะทางได้อย่างรวดเร็ว

กระบวนการประกอบด้วย:

  1. การฝึกโมเดลพื้นฐาน (เริ่มจากกรอบการทำงาน NeMo)
  2. การฝึกฝน/จำลองในสภาพแวดล้อม "gym" เพื่อสร้างคำตอบหรือทำตามคำแนะนำ
  3. การให้คะแนน/ตรวจสอบคำตอบกับระบบรางวัล (มนุษย์หรืออัตโนมัติ)
  4. การอัปเดต/ฝึกซ้ำโมเดลด้วยข้อมูลคุณภาพสูงที่ได้รับการตรวจสอบ เพื่อปรับให้มุ่งไปสู่คำตอบที่ได้คะแนนสูงขึ้น

วงจรที่เป็นระบบนี้ช่วยให้โมเดลพัฒนาในการเลือกการกระทำที่ได้รับรางวัลสูงขึ้น เหมือนนักเรียนที่พัฒนาทักษะผ่านการฝึกฝนซ้ำๆ ภายใต้การแนะนำ Nvidia ได้เปิดตัวสภาพแวดล้อม Gym 12 แห่งที่มุ่งเน้นงานที่มีผลกระทบสูง เช่น การเขียนโค้ดแข่งขัน คณิตศาสตร์ และการจัดตารางปฏิทินที่ใช้งานได้จริง

ความมุ่งมั่นที่ขยายของ Nvidia ต่อโอเพนซอร์ส

การเปิดตัว Nemotron ได้รับการสนับสนุนด้วยความมุ่งมั่นใน 3 ด้าน:

ไลบรารีและการวิจัยแบบเปิด

Nvidia กำลังเปิดเผยโค้ดจริงที่ใช้ในการฝึก Nemotron-3 เพื่อความโปร่งใส รวมถึงงานวิจัยที่อธิบายเทคนิคต่างๆ เช่น การสร้างข้อมูลสังเคราะห์และ RL

นักวิจัยของ Nvidia ยังคงผลักดันขอบเขตของ AI ด้วยงานวิจัยที่โดดเด่น ได้แก่:

  • Nemotron Cascade: โมเดลนักเรียนที่มีประสิทธิภาพเหนือกว่าครู (DeepSeek โมเดลพารามิเตอร์ 500-600 พันล้าน) ในการเขียนโค้ด
  • RLP (Reinforcement Learning in Pretraining): เทคนิคในการฝึกโมเดลการให้เหตุผลให้คิดด้วยตัวเองตั้งแต่ช่วงแรกของกระบวนการ

ชุดข้อมูลคุณภาพสูง

Nvidia กำลังเปลี่ยนแนวคิดเรื่องข้อมูลจาก big data ไปสู่การจัดการข้อมูลที่ฉลาดและมีคุณภาพที่ดีขึ้น บริษัทกำลังเปิดตัวชุดข้อมูลใหม่หลายชุด:

  • ข้อมูล Pre-training: โทเค็นใหม่มากกว่า 3 ล้านล้านของข้อมูล pre-training คุณภาพสูง ที่สร้างขึ้นโดยสังเคราะห์และกรองเพื่อคุณภาพ "all signal, no noise" โดยใช้การคำนวณมากกว่า 1 ล้านชั่วโมงของ H100
  • ข้อมูล Post-training (Safe Instruction): ชุดข้อมูล 13 ล้านตัวอย่างที่ใช้เฉพาะผลลัพธ์ของโมเดลที่ได้รับอนุญาต ทำให้ปลอดภัยสำหรับการใช้งานในองค์กร
  • ชุดข้อมูล RL: สภาพแวดล้อม reinforcement learning ใหม่ 12 แห่งและชุดข้อมูลที่ครอบคลุม 900,000 ตัวอย่างงานและ prompts
  • Nemotron-agent safety: ให้ OpenTelemetry traces ที่ติดป้ายกำกับ 10,800 รายการจากขั้นตอนการทำงานของ agent ที่ใช้เครื่องมือหลายขั้นตอน เพื่อช่วยประเมินและลดความเสี่ยงด้านความปลอดภัย

พิมพ์เขียวสำหรับองค์กรและระบบนิเวศ

Nvidia กำลังให้พิมพ์เขียวอ้างอิงเพื่อเร่งการนำไปใช้ โดยรวมโมเดล Nemotron-3 และไลบรารีเร่งความเร็ว:

  • IQ Deep Researcher: สำหรับการสร้างผู้ช่วยวิจัย AI ในองค์กร
  • การค้นหาและสรุปวิดีโอ: เปลี่ยนวิดีโอหลายชั่วโมงให้เป็นข้อมูลเชิงลึกในไม่กี่วินาที
  • Enterprise RAG: พิมพ์เขียว retrieval-augment generation ที่ได้รับการปรับให้เหมาะสมที่สุดสำหรับองค์กร

ระบบนิเวศ Nemotron มีพันธมิตรสำคัญสนับสนุน เช่น Amazon Bedrock, CrowdStrike Holdings Inc. และ ServiceNow Inc. โดย ServiceNow ระบุว่า 15% ของข้อมูล pretraining สำหรับโมเดล Apriel 1.6 Thinker ของพวกเขามาจากชุดข้อมูล Nemotron ของ Nvidia

อุตสาหกรรมกำลังลดกระแสความนิยมของ AI และเราควรเริ่มเห็นกรณีการใช้งานจริงมากขึ้น ตระกูล Nemotron-3 เหมาะอย่างยิ่งสำหรับยุคนี้เนื่องจากให้พื้นฐานโอเพนซอร์สที่มีประสิทธิภาพสำหรับการพัฒนา Agentic AI รุ่นต่อไป ซึ่งตอกย้ำความมุ่งมั่นของ Nvidia ในการทำให้นวัตกรรม AI เป็นประชาธิปไตย# Nvidia เปิดตัว AI Foundry เพื่อเร่งการพัฒนาโมเดล AI แบบกำหนดเอง

Nvidia ได้เปิดตัวบริการใหม่ภายใต้ชื่อ "AI Foundry" ซึ่งออกแบบมาเพื่อช่วยให้องค์กรต่างๆ สามารถพัฒนาโมเดล AI แบบกำหนดเองได้อย่างรวดเร็วและมีประสิทธิภาพมากขึ้น บริการดังกล่าวถือเป็นส่วนสำคัญในกลยุทธ์ของ Nvidia ที่มุ่งขยายการเข้าถึงเทคโนโลยี AI ให้แพร่หลายในวงกว้าง

AI Foundry จะเป็นเครื่องมือที่ช่วยให้บริษัทต่างๆ สามารถสร้าง ปรับแต่ง และนำโมเดล AI ไปใช้งานให้ตอบโจทย์ความต้องการเฉพาะทางของแต่ละธุรกิจได้อย่างเต็มประสิทธิภาพ โดยได้รับการสนับสนุนจากโครงสร้างพื้นฐานอันทรงพลังและความเชี่ยวชาญระดับสูงของ Nvidia

นักวิเคราะห์จาก ZK Research ได้ให้ความเห็นว่า การเปิดตัวบริการนี้ถือเป็นก้าวสำคัญที่จะช่วยให้องค์กรต่างๆ สามารถใช้ประโยชน์จากเทคโนโลยี AI ได้อย่างเต็มที่ โดยไม่จำเป็นต้องมีทรัพยากรและความเชี่ยวชาญในระดับเดียวกับบริษัทเทคโนโลยียักษ์ใหญ่

ทั้งนี้ บริการใหม่ดังกล่าวสอดคล้องกับวิสัยทัศน์ของ Nvidia ในการสร้างระบบนิเวศ AI แบบครบวงจรที่รองรับความต้องการของทั้งผู้ใช้ระดับองค์กรและนักพัฒนารายย่อยได้อย่างทั่วถึง

Why it matters

💡 ข่าวการเปิดตัวตระกูลโมเดล Nemotron-3 ของ Nvidia เป็นเรื่องที่ผู้สนใจเทคโนโลยี AI ไม่ควรพลาด เพราะแสดงให้เห็นถึงการเปลี่ยนแปลงครั้งสำคัญในวงการ AI โดย Nvidia กำลังผลักดันแนวคิดโอเพนซอร์สที่จะทำให้เทคโนโลยี AI เข้าถึงได้ง่ายขึ้นสำหรับทุกคน ไม่ใช่แค่บริษัทยักษ์ใหญ่เท่านั้น นอกจากนี้ ความสามารถของโมเดลในการรองรับบริบทยาวถึง 1 ล้านโทเค็นและประสิทธิภาพที่เพิ่มขึ้นจะเปิดโอกาสใหม่ๆ สำหรับการพัฒนาแอปพลิเคชัน AI ที่ซับซ้อนและชาญฉลาดยิ่งขึ้น

ข้อมูลอ้างอิงจาก https://siliconangle.com/2025/12/16/analysis-nvidia-nemotron-3-open-models-lead-efficient-agentic-ai/

Read more

คนทำงานมากขึ้นใช้ AI แต่ไม่รู้ว่านายจ้างใช้ด้วยหรือไม่ - ทำไมนี่จึงเป็นปัญหา

news

คนทำงานมากขึ้นใช้ AI แต่ไม่รู้ว่านายจ้างใช้ด้วยหรือไม่ - ทำไมนี่จึงเป็นปัญหา

การสำรวจล่าสุดจาก Gallup พบว่า 45% ของคนทำงานใช้ AI อย่างน้อยปีละครั้ง แต่เกือบ 1 ใน 4 ไม่ทราบว่าองค์กรของตนมีการนำ AI มาใช้หรือไม่ สะท้อนช่องว่างการสื่อสารระหว่างผู้บริหารกับพนักงาน ขณะที่การใช้ AI ในแต่ละอุตสาหกรรมมีความแตกต่างกันอย่างชัดเจน

By
OpenAI ประกาศอัปเกรด ChatGPT Images ด้วย 'ความเร็วในการสร้างภาพเร็วขึ้น 4 เท่า'

news

OpenAI ประกาศอัปเกรด ChatGPT Images ด้วย 'ความเร็วในการสร้างภาพเร็วขึ้น 4 เท่า'

OpenAI ประกาศอัปเกรด ChatGPT Images ครั้งใหญ่ ด้วยความเร็วในการสร้างภาพเพิ่มขึ้น 4 เท่า พร้อมปรับปรุงความแม่นยำในการตอบสนองคำสั่งและการแก้ไขภาพ หลังจาก Sam Altman ประกาศสถานการณ์ "code red" เพื่อเร่งพัฒนาคุณภาพ

By
ส่วนขยายบราวเซอร์ Chrome ยอดนิยมถูกจับได้ว่าดักจับบทสนทนา AI ของผู้ใช้นับล้าน

news

ส่วนขยายบราวเซอร์ Chrome ยอดนิยมถูกจับได้ว่าดักจับบทสนทนา AI ของผู้ใช้นับล้าน

ส่วนขยาย Chrome ยอดนิยมอย่าง Urban VPN ถูกพบว่าแอบเก็บข้อมูลการสนทนาของผู้ใช้กับแชทบอท AI ชื่อดังทั้ง ChatGPT, Claude, Copilot และอื่นๆ โดยไม่ได้รับอนุญาต แม้จะอ้างว่าเป็นฟีเจอร์ "AI protection" แต่ข้อมูลถูกส่งไปยังบริษัทโฆษณา

By
8 วิธีใช้ประโยชน์สูงสุดจาก Slide Decks ใน NotebookLM

news

8 วิธีใช้ประโยชน์สูงสุดจาก Slide Decks ใน NotebookLM

ค้นพบวิธีใช้ประโยชน์สูงสุดจาก Slide Decks ใน NotebookLM ที่ขับเคลื่อนด้วย Nano Banana Pro ตั้งแต่การแปลงงานวิจัยเป็นสไลด์สวยงาม การสร้างจากบันทึกคร่าวๆ ไปจนถึงการปรับแต่งตามสไตล์แบรนด์ เพื่อยกระดับการนำเสนอของคุณ

By