AI 週報:2026-06-08 ~ 2026-06-15
本週主旋律是模型效率與應用入口同步前進:小米把 1T 模型推到 1000 tokens/s,Google 讓 Gemini 進入 Maps,研究則提醒 LLM 在反直覺推理上仍會失手。

本週主旋律很清楚:模型跑得更快、入口更貼近日常,但推理可靠度還沒跟上。從小米 MiMo 的高吞吐模型到 Gemini 進入 Maps,產業在把 AI 從展示品推向可用介面;同時,機率題研究提醒我們,能力表現仍高度依賴題型與提示方式。
另一條線則是工程化落地。微調、代碼審查、容器工作流與 AI factory 都在說同一件事:真正的競爭不只在模型大小,而在部署、成本、流程與算力供應是否能接住需求。
趨勢雷達
訂閱 AI 趨勢週報
每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。
不會寄垃圾信,隨時可取消。
| 維度 | 信號 | 本週變化 | 影響 |
|---|---|---|---|
| 模型 | 強 | 小米 MiMo-V2.5-Pro-UltraSpeed 把 1T 模型推到最高 1000 tokens/s。 | 高吞吐會把「能不能用」改寫成「用多少成本、多久回本」。 |
| Agent | 中 | Google Gemini 進一步接入 Maps,Ask Maps 與導航對話化更完整。 | Agent 會更像內建工作流,而不是獨立聊天視窗。 |
| 開源 | 弱 | Linux 7.1-rc7 顯示 AMD Zen 6 支援持續成熟。 | 開源生態先行完成硬體適配,會影響後續伺服器與工作站採購節奏。 |
| 算力與基建 | 中 | 韓國與 Nvidia 對話聚焦 26 萬顆晶片、AI factory 與首爾研發中心。 | 主權 AI 與區域算力中心會把供應鏈競爭推向國家級配置。 |
| 應用 | 強 | Gemini 在 Google Maps 變成對話介面,RAG 與微調的分工也被重新討論。 | 應用層會更重視場景適配,文風、流程與地圖導航這類任務將分流處理。 |
| 政策與監管 | 平靜 | 無重大進展 | 監管本週沒有新錨點,但估值與披露壓力仍會回到 IPO 與大模型商業化討論。 |
重點事件
小米把 1T 模型推到 1000 tokens/s
發生什麼。 小米在 MiMo-V2.5-Pro-UltraSpeed 上把 1T 級模型推到最高 1000 tokens/s,並同步調整定價與舊模型退場時程。


為什麼重要。 這不是單純跑分,而是把大模型從「可展示」推進到「可計費、可排程、可部署」的工程狀態。當速度與價格一起變動,市場會開始用吞吐和單位成本評估模型,而不是只看參數量。
誰受影響、下一步觀察。 受影響的是雲端推理平台、終端廠商與企業採購方;接下來要看的是實際延遲、長上下文穩定性,以及新定價是否真的壓縮同級模型的使用門檻。
Gemini 進入 Google Maps,導航開始對話化
發生什麼。 Google 把 Gemini 更深地塞進 Google Maps,主打 Ask Maps 與 Immersive Navigation,讓地圖查詢與路線規劃更像對話。
為什麼重要。 地圖是高頻入口,一旦自然語言成為主要操作方式,AI 就不再只是回答問題,而是直接改寫使用者操作介面。這類整合比單獨推出聊天產品更容易累積黏性,也更容易把搜尋、導航與本地服務串成一條鏈。
誰受影響、下一步觀察。 受影響的是通勤族、旅遊用戶、在地商家與地圖 API 生態;下一步看 Google 是否把更多查詢、訂位與推薦動作接到同一個對話流程裡。
研究提醒:LLM 在反直覺機率題會失手
發生什麼。 研究指出,LLM 在標準機率題表現不錯,但遇到反直覺、改寫或帶誤導提示的題目時,準確率會明顯下滑。
為什麼重要。 這說明模型的「看起來會」和「穩定會」之間仍有差距,尤其在推理題、決策輔助與教育場景裡,題目措辭會直接影響輸出品質。對產品方來說,不能只看 benchmark 平均值,還要測邊界案例。
誰受影響、下一步觀察。 受影響的是做推理型產品的團隊、教育應用與評測平台;下一步要看是否有更針對反直覺題型的評測集與訓練方法出現。
微調與 RAG 的分工被重新釐清
發生什麼。 文章指出,當目標是文風而不是事實時,微調比 RAG 更有效;RAG 比較適合補事實,不適合改寫作風格。
為什麼重要。 這件事看似技術細節,實際上影響產品架構與成本。很多團隊把所有問題都交給 RAG,結果在語氣、格式與品牌口吻上效果有限;把任務拆清楚,才能少走冤枉路。
誰受影響、下一步觀察。 受影響的是內容生成、客服、自動寫作與企業知識助理;下一步看哪些團隊會把「事實補強」與「風格控制」拆成兩條管線。
下週觀察
- 關注 Google 是否在 Maps 之後,把 Gemini 更深接到搜尋與本地商家流程。
- 觀察 小米 MiMo-V2.5-Pro-UltraSpeed 的實測延遲、定價落地與舊模型退場是否按表推進。
- 留意 Nvidia 與韓國 的 AI factory 談判,特別是 26 萬顆晶片交付與首爾研發中心進度。
- 檢查 Linux 7.1 對 AMD Zen 6 的支援是否進一步進入主線整合。
- 追蹤是否有新的 LLM 推理評測,專門測反直覺機率題與提示改寫魯棒性。