Google TurboQuant: อัลกอริทึมใหม่เร่งความเร็ว AI Memory 8 เท่า ลดต้นทุนกว่า 50%
Google Research เปิดตัว TurboQuant อัลกอริทึม software-only ที่แก้ปัญหา KV Cache Bottleneck ของ LLMs ลด memory ได้ 6 เท่า เพิ่มความเร็ว attention 8 เท่า และลดต้นทุน enterprise กว่า 50% โดยไม่กระทบประสิทธิภาพโมเดล