Qwen2.5-Coder เปิดมิติใหม่ของ Open CodeLLMs

Qwen2.5-Coder โมเดลภาษาเพื่อการเขียนโค้ดรุ่นใหม่ล่าสุด มาพร้อมความสามารถครบครัน รองรับ 8 ภาษาโปรแกรมมิ่ง และสร้างสถิติใหม่ใน 10 benchmarks สำคัญ พร้อมตัวเลือกหลายขนาดตั้งแต่ 0.5B ถึง 32B parameters

Qwen2.5-Coder เปิดมิติใหม่ของ Open CodeLLMs

Key takeaway

  • Qwen2.5-Coder เป็นโมเดลภาษาเพื่อการเขียนโค้ดรุ่นใหม่ที่พัฒนาต่อยอดจากสถาปัตยกรรม Qwen2.5 มาพร้อมกับ tokenizer ขนาดใหญ่ และมีให้เลือกหลายขนาดตั้งแต่ 0.5B ถึง 32B parameters
  • โมเดลนี้ผ่านการ pre-training ด้วยข้อมูลมากกว่า 5.5 trillion tokens และสร้างสถิติใหม่ใน 10 benchmarks สำคัญ โดยเฉพาะรุ่น Qwen2.5-Coder-7B-Base ที่มีประสิทธิภาพเหนือกว่า StarCoder2 และ DeepSeek-Coder
  • จุดเด่นของ Qwen2.5-Coder คือความยืดหยุ่นในการใช้งาน รองรับภาษาโปรแกรมมิ่งยอดนิยม 8 ภาษา สามารถจัดการ input ได้สูงถึง 128k tokens และรองรับ quantized formats หลายรูปแบบ ทำให้เหมาะกับผู้ใช้ที่มีทรัพยากรคอมพิวเตอร์จำกัด

Qwen ประกาศเปิดตัว Qwen2.5-Coder series โมเดลภาษาเพื่อการเขียนโค้ดรุ่นใหม่ล่าสุด ที่มาพร้อมความสามารถครบครัน ตอบโจทย์การใช้งานจริง และรองรับการทำงานที่หลากหลาย โดยพัฒนาต่อยอดจากสถาปัตยกรรม Qwen2.5 ที่มี tokenizer ขนาดใหญ่เป็นพื้นฐาน

โมเดลชุดนี้มีให้เลือกหลายขนาดตั้งแต่ 0.5B ถึง 32B parameters โดดเด่นด้วยการ pre-training ด้วยข้อมูลมากกว่า 5.5 trillion tokens ผ่านสถาปัตยกรรม 28 layers และผ่านการ fine-tuning ด้วย synthetic datasets ที่สร้างโดย CodeQwen1.5 พร้อม executor สำหรับทดสอบการทำงานของโค้ดจริง

ด้านประสิทธิภาพ Qwen2.5-Coder สร้างสถิติใหม่ใน 10 benchmarks สำคัญ รวมถึง HumanEval และ BigCodeBench โดยรุ่น Qwen2.5-Coder-7B-Base มีความแม่นยำเหนือกว่า StarCoder2 และ DeepSeek-Coder รองรับภาษาโปรแกรมมิ่งยอดนิยม 8 ภาษา และสามารถจัดการ input ได้สูงถึง 128k tokens

จุดเด่นสำคัญคือความยืดหยุ่นในการใช้งาน ด้วยตัวเลือกหลายขนาดและการรองรับ quantized formats อย่าง GPTQ, AWQ และ GGUF ทำให้เหมาะกับผู้ใช้ที่มีทรัพยากรคอมพิวเตอร์จำกัด

การเปิดตัวครั้งนี้นับเป็นความก้าวหน้าครั้งสำคัญของ coding language models แบบ open-source ที่มอบทั้งประสิทธิภาพและความคุ้มค่าให้กับนักพัฒนาและนักวิจัยที่ต้องการใช้ AI เพื่อเพิ่มประสิทธิภาพในการพัฒนาซอฟต์แวร์

Why it matters

💡 การเปิดตัว Qwen2.5-Coder ถือเป็นข่าวสำคัญที่นักพัฒนาและผู้สนใจด้านเทคโนโลยี AI ไม่ควรพลาด เพราะนี่คือการปฏิวัติวงการ Open Source Code LLMs ครั้งใหม่ ที่มาพร้อมความสามารถระดับท็อปในการเขียนโค้ด รองรับหลายภาษาโปรแกรมมิ่ง มีประสิทธิภาพสูงกว่าคู่แข่งในหลาย benchmark และที่สำคัญคือมีความยืดหยุ่นสูง สามารถปรับใช้ได้ตามทรัพยากรที่มี ทำให้เป็นเครื่องมือที่คุ้มค่าสำหรับการพัฒนาซอฟต์แวร์ในยุคปัจจุบัน

ข้อมูลอ้างอิงจาก https://www.marktechpost.com/2024/11/11/qwen-open-sources-the-powerful-diverse-and-practical-qwen2-5-coder-series-0-5b-1-5b-3b-7b-14b-32b/?utm_source=flipboard&utm_content=topic%2Fartificialintelligence

Read more

OpenAI เปิดตัวฟีเจอร์ 'ChatGPT Health' พร้อมการเชื่อมต่อกับ Apple Health

news

OpenAI เปิดตัวฟีเจอร์ 'ChatGPT Health' พร้อมการเชื่อมต่อกับ Apple Health

OpenAI เปิดตัว ChatGPT Health ฟีเจอร์ใหม่ที่เชื่อมต่อกับ Apple Health และแพลตฟอร์มสุขภาพอื่นๆ พัฒนาร่วมกับแพทย์กว่า 260 คน จาก 60 ประเทศ เน้นความปลอดภัยและความเป็นส่วนตัว โดยไม่นำข้อมูลไปฝึกโมเดล AI

By
CIO จะรับมือกับภัยคุกคามทางไซเบอร์ที่ขับเคลื่อนด้วย AI ได้อย่างไร

news

CIO จะรับมือกับภัยคุกคามทางไซเบอร์ที่ขับเคลื่อนด้วย AI ได้อย่างไร

ภัยคุกคามทางไซเบอร์ที่ขับเคลื่อนด้วย AI กำลังเพิ่มความเสี่ยงให้องค์กร โดยเฉพาะในภาคสาธารณสุข CIO ต้องสร้างสมดุลระหว่างความปลอดภัยกับนวัตกรรม ผ่านการฝึกอบรมพนักงาน การใช้เทคโนโลยี Zero Trust และการยืนยันตัวตนหลายปัจจัย

By
วุฒิสมาชิกเรียกร้องคำตอบเกี่ยวกับของเล่น AI จากผู้ผลิตชั้นนำ

news

วุฒิสมาชิกเรียกร้องคำตอบเกี่ยวกับของเล่น AI จากผู้ผลิตชั้นนำ

วุฒิสมาชิก Blackburn และ Blumenthal เรียกร้องข้อมูลจากผู้ผลิตของเล่น AI รายใหญ่ 6 บริษัท เกี่ยวกับนโยบายการแชร์ข้อมูล การทดสอบผลกระทบต่อเด็ก และมาตรการป้องกันเนื้อหาไม่เหมาะสม หลังพบว่าของเล่นบางชิ้นมีส่วนร่วมในการสนทนาที่มีเนื้อหาทางเพศ

By
คนทำงานมากขึ้นใช้ AI แต่ไม่รู้ว่านายจ้างใช้ด้วยหรือไม่ - ทำไมนี่จึงเป็นปัญหา

news

คนทำงานมากขึ้นใช้ AI แต่ไม่รู้ว่านายจ้างใช้ด้วยหรือไม่ - ทำไมนี่จึงเป็นปัญหา

การสำรวจล่าสุดจาก Gallup พบว่า 45% ของคนทำงานใช้ AI อย่างน้อยปีละครั้ง แต่เกือบ 1 ใน 4 ไม่ทราบว่าองค์กรของตนมีการนำ AI มาใช้หรือไม่ สะท้อนช่องว่างการสื่อสารระหว่างผู้บริหารกับพนักงาน ขณะที่การใช้ AI ในแต่ละอุตสาหกรรมมีความแตกต่างกันอย่างชัดเจน

By