Gemini 1.5 與 2.0 Flash 更新上線
Google 先在 9 月更新 Gemini 1.5 Pro-002、Flash-002,12 月再推 2.0 Flash Experimental,補上即時多模態、圖像生成、語音與搜尋整合。

Google 在 2024 年 9 月與 12 月更新 Gemini,加入 1.5 Pro-002、1.5 Flash-002 和 2.0 Flash Experimental。
Google 先在 2024 年 9 月 24 日釋出 Gemini 1.5 Pro-002 與 1.5 Flash-002,接著在 2024 年 12 月 11 日推出 Gemini 2.0 Flash Experimental。這波更新把即時多模態輸入、原生圖像生成、可控文字轉語音、搜尋整合和新工具鏈,一次塞進同一條產品線。
| 項目 | 數值 |
|---|---|
| Gemini-1.5-Pro-002 release | 2024-09-24 |
| Gemini-1.5-Flash-002 release | 2024-09-24 |
| Gemini 2.0 Flash Experimental announcement | 2024-12-11 |
| 1.5 context window | 1 million tokens |
發生了什麼
訂閱 AI 趨勢週報
每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。
不會寄垃圾信,隨時可取消。
這次不是單純修補版本號,而是把 Gemini 1.5 系列重新整理後再往前推。1.5 Pro-002 與 1.5 Flash-002 延續了混合專家架構與 100 萬 token 上下文視窗,重點在穩定性、輸出品質與部署體驗。

到了 12 月,Google 把焦點移到 Google Gen AI SDK 可直接接上的 Gemini 2.0 Flash Experimental。這版把模型從「能聊天」往「能互動、能執行」推進,包含 Multimodal Live API、原生圖像生成、可控語音輸出與 watermarking,還把 Google Search 直接納入流程。
如果把更新拆開看,Google 其實同時在補模型能力與開發者工具。前者讓輸入輸出形式更完整,後者則讓團隊更容易把 Gemini 接到產品裡,而不是只拿來做 demo。
這也解釋了為什麼 Jules 會一起出現。它是面向 GitHub 的實驗性 coding agent,代表 Google 想把 Gemini 放進寫程式、搜尋資料、回覆內容這些高頻工作流,而不只停在對話框裡。
- 2024-09-24:Gemini 1.5 Pro-002 與 1.5 Flash-002 上線。
- 2024-12-11:Gemini 2.0 Flash Experimental 公布。
- 2.0 Flash 新增即時音訊與影片輸入。
- 同時加入圖像生成、文字轉語音、搜尋與 SDK 支援。
為什麼重要
對開發者來說,這次更新最直接的變化是整合成本下降。以前要做語音助理、看圖回應或影片互動,常常得串多個模型與外部服務;現在 Gemini 2.0 Flash 把這些能力往同一個 API 面收斂,原型開發會快很多。

對產品團隊來說,搜尋、語音、圖像與 agent 能力放在同一套模型裡,代表可以更快做出多模態產品。這會影響客服、教育、內容生成、程式輔助與企業內部知識查詢等場景,因為系統不必再在不同供應商之間來回切換。
對產業面來看,Google 的策略也很清楚:競爭焦點不再只是模型分數,而是誰能把模型包成可用的工具。當模型開始直接支援 agent、搜尋與開發 SDK,平台黏著度就不只來自回答品質,還來自整個生態系的接入便利。
真正的問題是,這些功能更新能不能轉成長期採用。若開發者把 Gemini 當成預設選項,Google 就不只是在追趕模型能力,而是在搶下一代 AI 應用的入口。
下一輪競爭,拼的可能不是誰先喊出更大的參數,而是誰先把模型變成真的能上線的產品零件。