CMI News — Google terus mendorong inovasi di tengah lonjakan kebutuhan komputasi berbasis kecerdasan buatan (AI).
Kali ini, Google mengembangkan TurboQuant, algoritma kompresi memori untuk mengatasi krisis RAM global. dikutip dari kompas Senin, (4/5/2026).
Melalui Google Research, Google mengembangkan TurboQuant untuk menekan penggunaan memori saat inferensi, yakni saat model AI menghasilkan output.
Pendekatan ini menargetkan salah satu kendala utama dalam sistem AI modern: keterbatasan working memory.
Dalam praktiknya, model AI membutuhkan memori besar untuk menyimpan konteks sementara, terutama di komponen KV cache.
Komponen ini berperan penting dalam membantu model memahami dan mengingat informasi selama proses komputasi. Ketika kapasitas memori terbatas, performa AI pun ikut terhambat.
TurboQuant hadir untuk mengatasi masalah tersebut dengan mengandalkan teknik vector quantization, yaitu metode yang menyederhanakan representasi data numerik berbentuk vektor agar lebih ringkas tanpa mengorbankan informasi penting.













