標籤
1 篇文章
Tether 把 TurboQuant 納入 QVAC SDK 0.12.0,主打把本地 AI 的 KV cache 記憶體需求最高壓到 5 倍以下,讓長上下文推理更適合筆電與邊緣裝置。