Nous Research เปิดตัว Hermes 4 โมเดล AI แบบ Open-source รายใหม่ท้าชน AI ยักษ์ใหญ่
Nous Research เปิดตัว Hermes 4 โมเดล AI โอเพนซอร์สรุ่นใหม่ ขนาด 405 billion parameters พร้อมฟีเจอร์ hybrid reasoning ท้าชนยักษ์ใหญ่อย่าง OpenAI และ Google ด้วยผลทดสอบที่เหนือกว่า GPT-4
Key takeaway
- Hermes 4 เป็นโมเดล AI แบบ Open-source ที่มีขนาด 405 billion parameters และมีประสิทธิภาพสูงในการทดสอบต่างๆ โดยทำคะแนน MATH-500 benchmark ได้ถึง 96.3% ซึ่งสูงกว่า GPT-4 และ Claude Sonnet
- จุดเด่นของ Hermes 4 คือฟีเจอร์ "hybrid reasoning" ที่ให้ผู้ใช้เลือกรูปแบบการตอบสนองได้ทั้งแบบรวดเร็วและแบบวิเคราะห์เป็นขั้นตอน ผ่านการใช้tags และไม่มีข้อจำกัดด้านความปลอดภัยเหมือน AI เชิงพาณิชย์ทั่วไป
- การพัฒนา Hermes 4 ใช้เทคโนโลยี DataForge สำหรับสร้างข้อมูลสังเคราะห์และ Atropos framework สำหรับ Reinforcement Learning โดยใช้ NVIDIA B200 GPUs 192 เครื่อง รวมเวลาเทรน 71,616 ชั่วโมง ด้วยข้อมูลฝึกฝนมากกว่า 5.1 ล้านตัวอย่าง
Nous Research ประกาศเปิดตัว Hermes 4 Large Language Model รุ่นใหม่ล่าสุดในรูปแบบ Open-source ที่มีศักยภาพในการแข่งขันกับระบบ AI ของบริษัทชั้นนำอย่าง OpenAI, Google และ Anthropic
จุดเด่นของ Hermes 4 คือการมาพร้อมฟีเจอร์ "hybrid reasoning" ที่ช่วยให้ผู้ใช้สามารถเลือกรูปแบบการตอบสนองได้ทั้งแบบรวดเร็วและแบบวิเคราะห์เป็นขั้นตอนผ่านการใช้tags
ด้านประสิทธิภาพ โมเดลนี้มีขนาด 405 billion parameters และทำคะแนนในการทดสอบต่างๆ ได้อย่างน่าประทับใจ โดยได้คะแนน MATH-500 benchmark ที่ 96.3%, AIME'24 ที่ 81.9% และ RefusalBench ที่ 57.1% ซึ่งสูงกว่า GPT-4 และ Claude Sonnet 4
การพัฒนา Hermes 4 ใช้เทคโนโลยีหลักคือ DataForge ระบบสร้างข้อมูลสังเคราะห์แบบ graph-based และ Atropos framework สำหรับ Reinforcement Learning แบบ open-source โดยใช้ NVIDIA B200 GPUs 192 เครื่องในการเทรนรวม 71,616 ชั่วโมง ด้วยข้อมูลฝึกฝนกว่า 5.1 ล้านตัวอย่าง
สิ่งที่น่าสนใจคือ Hermes 4 ไม่มีข้อจำกัดด้านความปลอดภัยเหมือน AI เชิงพาณิชย์ทั่วไป แต่เน้นให้อำนาจการควบคุมอยู่ที่ผู้ใช้และความโปร่งใสในการทำงานของระบบNous Research เปิดตัว Hermes 4 โมเดล AI รุ่นใหม่พร้อมความสามารถด้านการประมวลเหตุผลขั้นสูง
Nous Research ประกาศเปิดตัว Hermes 4 โมเดล AI ขนาด 14 billion parameter ที่มาพร้อมนวัตกรรมการแก้ไขปัญหาการวนลูปความคิดที่ไม่สิ้นสุด โดยจำกัดการประมวลผลที่ 30,000 tokens ซึ่งช่วยลดการสร้างผลลัพธ์ที่ยาวเกินไปได้ถึง 65-79% โดยยังคงรักษาประสิทธิภาพการให้เหตุผลไว้ได้อย่างสมบูรณ์
โมเดลดังกล่าวได้เผยแพร่แบบ open-source บนแพลตฟอร์ม Hugging Face พร้อมให้บริการผ่าน API ด้วย chat interface รูปแบบใหม่ โดยได้ร่วมมือกับพันธมิตรด้าน inference providers อย่าง Chutes, Nebius และ Luminal
บริษัทซึ่งได้รับเงินทุนสนับสนุน 65 ล้านดอลลาร์จาก Paradigm กำลังพัฒนาโครงการ Psyche Network ระบบ distributed training บนเทคโนโลยี blockchain ความสำเร็จครั้งนี้แสดงให้เห็นว่าบริษัทขนาดเล็กสามารถสร้างนวัตกรรม AI ได้แม้มีทรัพยากรจำกัด
อย่างไรก็ตาม Hermes 4 ยังมีข้อจำกัดด้านการต้องการทรัพยากรการประมวลผลสูง และอาจไม่สะดวกในการใช้งานเมื่อเทียบกับบริการ AI เชิงพาณิชย์อื่นๆ เช่น ChatGPT หรือ Claude
Why it matters
💡 การเปิดตัว Hermes 4 จาก Nous Research ถือเป็นความก้าวหน้าที่สำคัญในวงการ AI โดยเฉพาะในแง่ของการเป็น Open-source ที่ท้าทายบริษัทยักษ์ใหญ่ ด้วยความสามารถที่โดดเด่นทั้งด้าน hybrid reasoning และประสิทธิภาพที่สูงกว่า GPT-4 ในหลายด้าน ทำให้นี่เป็นข่าวที่นักพัฒนาและผู้สนใจ AI ไม่ควรพลาด เพราะอาจเป็นจุดเปลี่ยนสำคัญของการพัฒนา AI แบบเปิดที่ให้อิสระแก่ผู้ใช้งานมากขึ้น