模型發布
最新 AI 模型發布、基準測試與性能比較。追蹤 OpenAI、Anthropic、Google、Meta 等各家模型動態。

Claude Tag 把 Slack 變成 AI 同事
Anthropic 推出 Claude Tag 測試版,讓 Claude 進駐 Slack 當長駐同事,並預告 Sonnet 5 與身分驗證機制。

OpenAI自研芯片不是秀肌肉,而是英伟达的真实威胁
OpenAI的首颗自研推理芯片Jalapeño不是公关展示,而是英伟达定价权开始松动的信号,因為推理成本、供應鏈與議價權都在被重新分配。

K3s v1.34.9 更新重點整理
K3s v1.34.9+k3s1 跟進 Kubernetes 1.34.9,並更新 Traefik、containerd、CoreDNS 等元件。這次是維運型更新,但 Traefik 介接名稱變更,升級前要先檢查設定。

Kimi 2.7 讓價格成為真正的寫碼基準
對多數寫碼團隊來說,Kimi 2.7 比 Claude Fable 5 更值得買,因為價格與可擴用性才是實際採購基準。

Kimi K2.6 登頂程式與代理式 AI 基準
Moonshot AI 在 2026-06-26 發布 Kimi K2.6,主打 262,144 token 長上下文、300 子代理與 4,000 步協作,並在多項程式與代理式基準拿下高分。

Llama Legends 3.8.0 推出 Season 3 英雄與突襲
Llama Legends 3.8.0 加入 100 張英雄卡、12 個成就、4 個突襲王與 Atlas Ancient 卡,還有 Work Llama 客製化與免費序號。

oMLX 0.4.5.dev1 讓長上下文更快
oMLX 0.4.5.dev1 為 GLM-5.2 和 MiniMax M3 加入自訂 kernel,長上下文 prefill 明顯加速,也修掉 cache 與 benchmark 載入問題。

Grok 4.5 先進 Tesla 和 SpaceX 內測
xAI 的 Grok 4.5 已在 Tesla 和 SpaceX 進入私有測試。這是首次已知的內部部署,重點在於先拿真實工作流程驗證模型。

Google OpenRL 把 RL 細調搬上 Kubernetes
Google OpenRL 讓團隊在自己的 Kubernetes 叢集上做 LLM post-training 與 fine-tuning,重點是把研究流程和基礎架構拆開,減少 RL 迭代時的雜務。

DiffusionGemma 在 RTX 與 DGX 跑很快
DiffusionGemma 改用平行生成文字,NVIDIA 稱它在 RTX、RTX PRO 與 DGX 上可更快跑本地推論,單機互動體驗更順。

GLM-5.2 用更低成本打贏 GPT-5.5
Z.ai 的 GLM-5.2 在多項 coding benchmark 上贏過 GPT-5.5,還主打只有約 1/6 成本。這篇整理分數、成本、開放權重優勢,看看它對 coding agent 市場的壓力有多大。

OpenAI 收緊 GPT-5.6 上線節奏
OpenAI 先讓可信合作夥伴測試 GPT-5.6 Sol、Terra、Luna,再擴大開放。這次延後不只是產品排程,也反映美國政府開始介入前沿 AI 上線流程。

Ubuntu 26.10 Snapshot 2 進入測試期
Ubuntu 26.10 Snapshot 2 已開放測試,現階段維持 Linux kernel 7.0 與 GNOME 50,後續預計升到 kernel 7.2、GNOME 51 和 Mesa 26.2。

Claude Fable 5 上線:1M 上下文、$10/$50
Anthropic 推出 Claude Fable 5 與限量版 Mythos 5,主打 1M token 上下文、128k 輸出與新的 refusal 流程,開發者要同步調整錯誤處理與計費邏輯。

Google 把 Gemini 3.5 Pro 延到 7 月
Google 把 Gemini 3.5 Pro 從 6 月延到 7 月,重點在早期測試回饋、token 效率與 agent 工作流。這次延後也反映 Google 在 OpenAI 和 Anthropic 壓力下,選擇先把模型磨好再上線。

Gemini 3.5 Flash 把 computer use 變成預設能力,…
Google 把 computer use 內建進 Gemini 3.5 Flash 是正確方向,因為代理能力只有成為模型原生功能,才有機會真正進入日常工作流程。

小米 MiMo-V2.5-Pro:價格、評測與限制
小米 MiMo-V2.5-Pro 是一款 text-only 模型,主打 1M token 長上下文、程式碼與 agent 工作,價格落在中段,適合大型文件與多步驟任務。

MiniMax M3 證明開放權重前沿模型已經重要
MiniMax M3 顯示開放權重模型已能在程式碼、代理、長上下文與多模態上,和前沿閉源模型正面競爭。

OpenAI Sora 企業硬體瞄準影片工作流
OpenAI 傳出把 Sora 做成企業硬體,主打本地生成影片。售價 2,499 美元,規格含 32GB RAM、1TB 儲存與 4K OLED,鎖定工作室、代理商與重視資料保密的團隊。

GPT-5.6 這週可能登場
OpenAI 傳出本週可能推出 GPT-5.6,重點是 150 萬 token 上下文與接近 90% 的市場押注。

GPT-5.6 傳聞:2M 上下文與寫碼升級
傳聞指 OpenAI 可能在 6 月 25 日推出 GPT-5.6,主打 200 萬 token 上下文、agentic coding 與更低定價,直接對上 Anthropic。

Kimi 的長上下文一路加大
Moonshot AI 的 Kimi 從長上下文聊天機器人,走到 agent 與 1T 參數模型。Kimi K2.5 在 2026 年 1 月登場,也把產品線推到更複雜的階段。

Midjourney Medical 的 60 秒掃描,還沒到臨床
Midjourney Medical 宣稱 60 秒可完成全身超音波掃描,但目前只有概念展示、合作傳聞與監管空窗,臨床證據還不夠。

GLM-5.2 開源:1M 上下文上線
智譜開源 GLM-5.2,主打 1M 上下文、Coding 與長程任務,並同步開放 API、Hugging Face、ModelScope 與多種推理框架接入。

Apple 把 AI 直接塞進日常 App
Apple 2026 的 Apple Intelligence 把 AI 放進 Photos、Safari、Passwords、Messages 和 Siri,主打裝置端隱私、日常任務與更實用的系統整合。

Kimi K2.7-Code 主打快,但證據還不夠
Moonshot 的 Kimi K2.7-Code 加了 HighSpeed Mode,主打更快、Token 更省,但目前只有官方 benchmark 能支撐這些說法。

Kimi K2.7 上線與驗證清單
這篇教你確認 Kimi K2.7 模型 ID、做 A/B 測試,並把它接進現有 agent 工作流。

Linux 7.1 上線:FRED、NTFS、AMD 一次補齊
Linux Kernel 7.1 帶來預設啟用的 FRED、新 NTFS 驅動、AMD 電源管理調整與 12 顆新 SoC 支援,重點落在硬體相容與效能調校。

Fable 5 為何引發 AI 圈關注
Ethan Mollick 和 Andrej Karpathy 對 Fable 5 給出少見好評,讓這個模型立刻進入 AI 圈焦點。

Devin 2026 年 6 月定價拆解
Devin 目前從 20 美元起跳,Team 方案 500 美元,Enterprise 則走客製報價。這篇整理各方案限制、功能差異,還有它對工程團隊值不值得買。