標籤

Google Research

Google Research 聚焦模型推論、提示設計與系統效率等基礎問題，從記憶體壓縮到輸入策略都會影響成本與準確率。這類研究常直接改變 AI 服務的部署方式與評估方法。

3 篇文章

TurboQuant 在 Google 測試中省下 6x KV 快取

技術研究/6月8日

TurboQuant 在 Google 測試中省下 6x KV 快取

Google Research 公布 TurboQuant，可把 KV cache 記憶體壓到至少 6x 以上，並在長上下文測試中維持接近全精度表現。

TurboQuant 省 6 倍記憶體，還不掉準確率

技術研究/4月3日

TurboQuant 省 6 倍記憶體，還不掉準確率

Google Research 發表 TurboQuant，主打記憶體用量降到 1/6、推論快 8 倍，且在報告測試中沒有準確率損失。這篇看它怎麼改 AI 伺服器成本。

重複提示詞，準確率真的會上升

技術研究/4月2日

重複提示詞，準確率真的會上升

Google Research 研究發現，提示詞複製一次可讓 70 組模型與基準測試中的 47 組提升準確率，NameIndex 甚至從 21.33% 衝到 97.33%。