Nous Research เปิดตัว Hermes 4 โมเดล AI แบบ Open-source รายใหม่ท้าชน AI ยักษ์ใหญ่

Nous Research เปิดตัว Hermes 4 โมเดล AI โอเพนซอร์สรุ่นใหม่ ขนาด 405 billion parameters พร้อมฟีเจอร์ hybrid reasoning ท้าชนยักษ์ใหญ่อย่าง OpenAI และ Google ด้วยผลทดสอบที่เหนือกว่า GPT-4

Nous Research เปิดตัว Hermes 4 โมเดล AI แบบ Open-source รายใหม่ท้าชน AI ยักษ์ใหญ่

Key takeaway

  • Hermes 4 เป็นโมเดล AI แบบ Open-source ที่มีขนาด 405 billion parameters และมีประสิทธิภาพสูงในการทดสอบต่างๆ โดยทำคะแนน MATH-500 benchmark ได้ถึง 96.3% ซึ่งสูงกว่า GPT-4 และ Claude Sonnet
  • จุดเด่นของ Hermes 4 คือฟีเจอร์ "hybrid reasoning" ที่ให้ผู้ใช้เลือกรูปแบบการตอบสนองได้ทั้งแบบรวดเร็วและแบบวิเคราะห์เป็นขั้นตอน ผ่านการใช้tags และไม่มีข้อจำกัดด้านความปลอดภัยเหมือน AI เชิงพาณิชย์ทั่วไป
  • การพัฒนา Hermes 4 ใช้เทคโนโลยี DataForge สำหรับสร้างข้อมูลสังเคราะห์และ Atropos framework สำหรับ Reinforcement Learning โดยใช้ NVIDIA B200 GPUs 192 เครื่อง รวมเวลาเทรน 71,616 ชั่วโมง ด้วยข้อมูลฝึกฝนมากกว่า 5.1 ล้านตัวอย่าง

Nous Research ประกาศเปิดตัว Hermes 4 Large Language Model รุ่นใหม่ล่าสุดในรูปแบบ Open-source ที่มีศักยภาพในการแข่งขันกับระบบ AI ของบริษัทชั้นนำอย่าง OpenAI, Google และ Anthropic

จุดเด่นของ Hermes 4 คือการมาพร้อมฟีเจอร์ "hybrid reasoning" ที่ช่วยให้ผู้ใช้สามารถเลือกรูปแบบการตอบสนองได้ทั้งแบบรวดเร็วและแบบวิเคราะห์เป็นขั้นตอนผ่านการใช้tags

ด้านประสิทธิภาพ โมเดลนี้มีขนาด 405 billion parameters และทำคะแนนในการทดสอบต่างๆ ได้อย่างน่าประทับใจ โดยได้คะแนน MATH-500 benchmark ที่ 96.3%, AIME'24 ที่ 81.9% และ RefusalBench ที่ 57.1% ซึ่งสูงกว่า GPT-4 และ Claude Sonnet 4

การพัฒนา Hermes 4 ใช้เทคโนโลยีหลักคือ DataForge ระบบสร้างข้อมูลสังเคราะห์แบบ graph-based และ Atropos framework สำหรับ Reinforcement Learning แบบ open-source โดยใช้ NVIDIA B200 GPUs 192 เครื่องในการเทรนรวม 71,616 ชั่วโมง ด้วยข้อมูลฝึกฝนกว่า 5.1 ล้านตัวอย่าง

สิ่งที่น่าสนใจคือ Hermes 4 ไม่มีข้อจำกัดด้านความปลอดภัยเหมือน AI เชิงพาณิชย์ทั่วไป แต่เน้นให้อำนาจการควบคุมอยู่ที่ผู้ใช้และความโปร่งใสในการทำงานของระบบNous Research เปิดตัว Hermes 4 โมเดล AI รุ่นใหม่พร้อมความสามารถด้านการประมวลเหตุผลขั้นสูง

Nous Research ประกาศเปิดตัว Hermes 4 โมเดล AI ขนาด 14 billion parameter ที่มาพร้อมนวัตกรรมการแก้ไขปัญหาการวนลูปความคิดที่ไม่สิ้นสุด โดยจำกัดการประมวลผลที่ 30,000 tokens ซึ่งช่วยลดการสร้างผลลัพธ์ที่ยาวเกินไปได้ถึง 65-79% โดยยังคงรักษาประสิทธิภาพการให้เหตุผลไว้ได้อย่างสมบูรณ์

โมเดลดังกล่าวได้เผยแพร่แบบ open-source บนแพลตฟอร์ม Hugging Face พร้อมให้บริการผ่าน API ด้วย chat interface รูปแบบใหม่ โดยได้ร่วมมือกับพันธมิตรด้าน inference providers อย่าง Chutes, Nebius และ Luminal

บริษัทซึ่งได้รับเงินทุนสนับสนุน 65 ล้านดอลลาร์จาก Paradigm กำลังพัฒนาโครงการ Psyche Network ระบบ distributed training บนเทคโนโลยี blockchain ความสำเร็จครั้งนี้แสดงให้เห็นว่าบริษัทขนาดเล็กสามารถสร้างนวัตกรรม AI ได้แม้มีทรัพยากรจำกัด

อย่างไรก็ตาม Hermes 4 ยังมีข้อจำกัดด้านการต้องการทรัพยากรการประมวลผลสูง และอาจไม่สะดวกในการใช้งานเมื่อเทียบกับบริการ AI เชิงพาณิชย์อื่นๆ เช่น ChatGPT หรือ Claude

Why it matters

💡 การเปิดตัว Hermes 4 จาก Nous Research ถือเป็นความก้าวหน้าที่สำคัญในวงการ AI โดยเฉพาะในแง่ของการเป็น Open-source ที่ท้าทายบริษัทยักษ์ใหญ่ ด้วยความสามารถที่โดดเด่นทั้งด้าน hybrid reasoning และประสิทธิภาพที่สูงกว่า GPT-4 ในหลายด้าน ทำให้นี่เป็นข่าวที่นักพัฒนาและผู้สนใจ AI ไม่ควรพลาด เพราะอาจเป็นจุดเปลี่ยนสำคัญของการพัฒนา AI แบบเปิดที่ให้อิสระแก่ผู้ใช้งานมากขึ้น

ข้อมูลอ้างอิงจาก https://venturebeat.com/ai/nous-research-drops-hermes-4-ai-models-that-outperform-chatgpt-without-content-restrictions/?utm_source=flipboard&utm_content=user/venturebeat

Read more

เบราว์เซอร์ Comet AI จาก Perplexity เปิดให้ทุกคนใช้งานแล้ว

news

เบราว์เซอร์ Comet AI จาก Perplexity เปิดให้ทุกคนใช้งานแล้ว

Perplexity เปิดตัว Comet เว็บเบราว์เซอร์ AI ให้ทุกคนใช้งานฟรี มาพร้อมผู้ช่วย AI อัจฉริยะที่ตอบคำถามและทำงานแทนผู้ใช้ได้ ท้าทายการครองตลาดของ Google Chrome

By
ชายวัย 29 ปีถูกจับกุมหลังใช้ ChatGPT สร้างภาพไฟไหม้ก่อนก่อเหตุจริง

news

ชายวัย 29 ปีถูกจับกุมหลังใช้ ChatGPT สร้างภาพไฟไหม้ก่อนก่อเหตุจริง

ตำรวจจับกุม Jonathan Rinderknecht วัย 29 ปี ผู้ต้องสงสัยก่อเหตุไฟไหม้ใน Pacific Palisades หลังพบหลักฐานใช้ ChatGPT สร้างภาพเหตุการณ์ล่วงหน้า 5 เดือน เหตุคร่าชีวิต 12 ราย บ้านเสียหายกว่า 6,000 หลัง

By
การหยุดชะงักของระบบ IT ทำให้ธุรกิจสูญเสียเงิน 76 ล้านดอลลาร์ต่อปี

news

การหยุดชะงักของระบบ IT ทำให้ธุรกิจสูญเสียเงิน 76 ล้านดอลลาร์ต่อปี

ผลการศึกษาจาก New Relic เผยการหยุดชะงักของระบบ IT ทำให้ธุรกิจสูญเสียเงินมัธยฐาน 76 ล้านดอลลาร์ต่อปี หรือ 33,333 ดอลลาร์ต่อนาที พร้อมเผยสาเหตุหลักและแนวทางแก้ไข

By
โรงพยาบาลจำเป็นต้องเตรียมพร้อมรับมือการโจมตีแบบฟิชชิ่งที่ใช้ AI

news

โรงพยาบาลจำเป็นต้องเตรียมพร้อมรับมือการโจมตีแบบฟิชชิ่งที่ใช้ AI

ภัยคุกคามจากการโจมตีฟิชชิ่งที่ใช้ AI ในโรงพยาบาลเพิ่มขึ้นกว่า 700% ในปี 2024 สร้างความเสี่ยงต่อข้อมูลผู้ป่วยและระบบสาธารณสุข จำเป็นต้องเพิ่มการฝึกอบรมและระบบป้องกันอย่างเร่งด่วน

By