標籤
Google Research
Google Research 聚焦模型推論、提示設計與系統效率等基礎問題,從記憶體壓縮到輸入策略都會影響成本與準確率。這類研究常直接改變 AI 服務的部署方式與評估方法。
3 篇文章

技術研究/6月8日
TurboQuant 在 Google 測試中省下 6x KV 快取
Google Research 公布 TurboQuant,可把 KV cache 記憶體壓到至少 6x 以上,並在長上下文測試中維持接近全精度表現。

技術研究/4月3日
TurboQuant 省 6 倍記憶體,還不掉準確率
Google Research 發表 TurboQuant,主打記憶體用量降到 1/6、推論快 8 倍,且在報告測試中沒有準確率損失。這篇看它怎麼改 AI 伺服器成本。

技術研究/4月2日
重複提示詞,準確率真的會上升
Google Research 研究發現,提示詞複製一次可讓 70 組模型與基準測試中的 47 組提升準確率,NameIndex 甚至從 21.33% 衝到 97.33%。