分類

模型發布

最新 AI 模型發布、基準測試與性能比較。追蹤 OpenAI、Anthropic、Google、Meta 等各家模型動態。

Claude Tag 把 Slack 變成 AI 同事

Claude Tag 把 Slack 變成 AI 同事

Anthropic 推出 Claude Tag 測試版，讓 Claude 進駐 Slack 當長駐同事，並預告 Sonnet 5 與身分驗證機制。

OpenAI自研芯片不是秀肌肉，而是英伟达的真实威胁

OpenAI自研芯片不是秀肌肉，而是英伟达的真实威胁

OpenAI的首颗自研推理芯片Jalapeño不是公关展示，而是英伟达定价权开始松动的信号，因為推理成本、供應鏈與議價權都在被重新分配。

K3s v1.34.9 更新重點整理

K3s v1.34.9 更新重點整理

K3s v1.34.9+k3s1 跟進 Kubernetes 1.34.9，並更新 Traefik、containerd、CoreDNS 等元件。這次是維運型更新，但 Traefik 介接名稱變更，升級前要先檢查設定。

Kimi 2.7 讓價格成為真正的寫碼基準

Kimi 2.7 讓價格成為真正的寫碼基準

對多數寫碼團隊來說，Kimi 2.7 比 Claude Fable 5 更值得買，因為價格與可擴用性才是實際採購基準。

Kimi K2.6 登頂程式與代理式 AI 基準

Kimi K2.6 登頂程式與代理式 AI 基準

Moonshot AI 在 2026-06-26 發布 Kimi K2.6，主打 262,144 token 長上下文、300 子代理與 4,000 步協作，並在多項程式與代理式基準拿下高分。

Llama Legends 3.8.0 推出 Season 3 英雄與突襲

Llama Legends 3.8.0 推出 Season 3 英雄與突襲

Llama Legends 3.8.0 加入 100 張英雄卡、12 個成就、4 個突襲王與 Atlas Ancient 卡，還有 Work Llama 客製化與免費序號。

oMLX 0.4.5.dev1 讓長上下文更快

oMLX 0.4.5.dev1 讓長上下文更快

oMLX 0.4.5.dev1 為 GLM-5.2 和 MiniMax M3 加入自訂 kernel，長上下文 prefill 明顯加速，也修掉 cache 與 benchmark 載入問題。

Grok 4.5 先進 Tesla 和 SpaceX 內測

Grok 4.5 先進 Tesla 和 SpaceX 內測

xAI 的 Grok 4.5 已在 Tesla 和 SpaceX 進入私有測試。這是首次已知的內部部署，重點在於先拿真實工作流程驗證模型。

Google OpenRL 把 RL 細調搬上 Kubernetes

Google OpenRL 把 RL 細調搬上 Kubernetes

Google OpenRL 讓團隊在自己的 Kubernetes 叢集上做 LLM post-training 與 fine-tuning，重點是把研究流程和基礎架構拆開，減少 RL 迭代時的雜務。

DiffusionGemma 在 RTX 與 DGX 跑很快

DiffusionGemma 在 RTX 與 DGX 跑很快

DiffusionGemma 改用平行生成文字，NVIDIA 稱它在 RTX、RTX PRO 與 DGX 上可更快跑本地推論，單機互動體驗更順。

GLM-5.2 用更低成本打贏 GPT-5.5

GLM-5.2 用更低成本打贏 GPT-5.5

Z.ai 的 GLM-5.2 在多項 coding benchmark 上贏過 GPT-5.5，還主打只有約 1/6 成本。這篇整理分數、成本、開放權重優勢，看看它對 coding agent 市場的壓力有多大。

OpenAI 收緊 GPT-5.6 上線節奏

OpenAI 收緊 GPT-5.6 上線節奏

OpenAI 先讓可信合作夥伴測試 GPT-5.6 Sol、Terra、Luna，再擴大開放。這次延後不只是產品排程，也反映美國政府開始介入前沿 AI 上線流程。

Ubuntu 26.10 Snapshot 2 進入測試期

Ubuntu 26.10 Snapshot 2 進入測試期

Ubuntu 26.10 Snapshot 2 已開放測試，現階段維持 Linux kernel 7.0 與 GNOME 50，後續預計升到 kernel 7.2、GNOME 51 和 Mesa 26.2。

Claude Fable 5 上線：1M 上下文、$10/$50

Claude Fable 5 上線：1M 上下文、$10/$50

Anthropic 推出 Claude Fable 5 與限量版 Mythos 5，主打 1M token 上下文、128k 輸出與新的 refusal 流程，開發者要同步調整錯誤處理與計費邏輯。

Google 把 Gemini 3.5 Pro 延到 7 月

Google 把 Gemini 3.5 Pro 延到 7 月

Google 把 Gemini 3.5 Pro 從 6 月延到 7 月，重點在早期測試回饋、token 效率與 agent 工作流。這次延後也反映 Google 在 OpenAI 和 Anthropic 壓力下，選擇先把模型磨好再上線。

Gemini 3.5 Flash 把 computer use 變成預設能力，…

Gemini 3.5 Flash 把 computer use 變成預設能力，…

Google 把 computer use 內建進 Gemini 3.5 Flash 是正確方向，因為代理能力只有成為模型原生功能，才有機會真正進入日常工作流程。

小米 MiMo-V2.5-Pro：價格、評測與限制

小米 MiMo-V2.5-Pro：價格、評測與限制

小米 MiMo-V2.5-Pro 是一款 text-only 模型，主打 1M token 長上下文、程式碼與 agent 工作，價格落在中段，適合大型文件與多步驟任務。

MiniMax M3 證明開放權重前沿模型已經重要

MiniMax M3 證明開放權重前沿模型已經重要

MiniMax M3 顯示開放權重模型已能在程式碼、代理、長上下文與多模態上，和前沿閉源模型正面競爭。

OpenAI Sora 企業硬體瞄準影片工作流

OpenAI Sora 企業硬體瞄準影片工作流

OpenAI 傳出把 Sora 做成企業硬體，主打本地生成影片。售價 2,499 美元，規格含 32GB RAM、1TB 儲存與 4K OLED，鎖定工作室、代理商與重視資料保密的團隊。

GPT-5.6 這週可能登場

GPT-5.6 這週可能登場

OpenAI 傳出本週可能推出 GPT-5.6，重點是 150 萬 token 上下文與接近 90% 的市場押注。

GPT-5.6 傳聞：2M 上下文與寫碼升級

GPT-5.6 傳聞：2M 上下文與寫碼升級

傳聞指 OpenAI 可能在 6 月 25 日推出 GPT-5.6，主打 200 萬 token 上下文、agentic coding 與更低定價，直接對上 Anthropic。

Kimi 的長上下文一路加大

Kimi 的長上下文一路加大

Moonshot AI 的 Kimi 從長上下文聊天機器人，走到 agent 與 1T 參數模型。Kimi K2.5 在 2026 年 1 月登場，也把產品線推到更複雜的階段。

Midjourney Medical 的 60 秒掃描，還沒到臨床

Midjourney Medical 的 60 秒掃描，還沒到臨床

Midjourney Medical 宣稱 60 秒可完成全身超音波掃描，但目前只有概念展示、合作傳聞與監管空窗，臨床證據還不夠。

GLM-5.2 開源：1M 上下文上線

GLM-5.2 開源：1M 上下文上線

智譜開源 GLM-5.2，主打 1M 上下文、Coding 與長程任務，並同步開放 API、Hugging Face、ModelScope 與多種推理框架接入。

Apple 把 AI 直接塞進日常 App

Apple 把 AI 直接塞進日常 App

Apple 2026 的 Apple Intelligence 把 AI 放進 Photos、Safari、Passwords、Messages 和 Siri，主打裝置端隱私、日常任務與更實用的系統整合。

Kimi K2.7-Code 主打快，但證據還不夠

Kimi K2.7-Code 主打快，但證據還不夠

Moonshot 的 Kimi K2.7-Code 加了 HighSpeed Mode，主打更快、Token 更省，但目前只有官方 benchmark 能支撐這些說法。

Kimi K2.7 上線與驗證清單

Kimi K2.7 上線與驗證清單

這篇教你確認 Kimi K2.7 模型 ID、做 A/B 測試，並把它接進現有 agent 工作流。

Linux 7.1 上線：FRED、NTFS、AMD 一次補齊

Linux 7.1 上線：FRED、NTFS、AMD 一次補齊

Linux Kernel 7.1 帶來預設啟用的 FRED、新 NTFS 驅動、AMD 電源管理調整與 12 顆新 SoC 支援，重點落在硬體相容與效能調校。

Fable 5 為何引發 AI 圈關注

Fable 5 為何引發 AI 圈關注

Ethan Mollick 和 Andrej Karpathy 對 Fable 5 給出少見好評，讓這個模型立刻進入 AI 圈焦點。

Devin 2026 年 6 月定價拆解

Devin 2026 年 6 月定價拆解

Devin 目前從 20 美元起跳，Team 方案 500 美元，Enterprise 則走客製報價。這篇整理各方案限制、功能差異，還有它對工程團隊值不值得買。

已到底部