標籤
AI 推論
3 篇文章

工具應用/5月20日
Azure Linux 4.0 與 Container Linux 正式上線
Microsoft 在 2026 年 5 月 18 日推出 Azure Linux 4.0,並讓 Azure Container Linux 正式可用,主打 Azure VM 與 AKS 的 AI 與容器工作負載。

技術研究/4月3日
TurboQuant 省 6 倍記憶體,還不掉準確率
Google Research 發表 TurboQuant,主打記憶體用量降到 1/6、推論快 8 倍,且在報告測試中沒有準確率損失。這篇看它怎麼改 AI 伺服器成本。

技術研究/4月2日
TurboQuant 解不了記憶體荒
Google 的 TurboQuant 可把 KV-cache 記憶體用量降到 6 倍,但更長上下文、更多 agent 與更高吞吐,可能把 DRAM 和 NAND 需求繼續往上推。