Gemini 3.5 Live Translate 擴至70+語言
Google 推出 Gemini 3.5 Live Translate,支援 70+ 語言、延遲僅數秒,並同步開放給開發者、Meet 與 Google Translate。

Google 推出 Gemini 3.5 Live Translate,支援 70+ 語言的近即時語音翻譯,並開始向開發者、Meet 和手機 App 分批開放。
Google 在 2026 年 6 月 9 日發布 Gemini 3.5 Live Translate,主打 speech-to-speech 即時翻譯。這次不是單純做文字轉譯,而是讓譯文跟著說話者節奏走,延遲只剩幾秒。
官方同時丟出幾個關鍵數字:支援 70+ 語言、Meet 內可對應 2,000+ 語言組合、開發者可用 public preview,Google Meet 則會在本月進入 private preview。對做語音產品的人來說,這代表 Google 正把即時翻譯從 demo 推向可用功能。
| 項目 | 數值 |
|---|---|
| Languages supported | 70+ |
| Language combinations in Meet | 2,000+ |
| Developer access | Public preview |
| Google Meet access | Private preview this month |
| Translation delay | Just a few seconds behind speaker |
發生了什麼
訂閱 AI 趨勢週報
每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。
不會寄垃圾信,隨時可取消。
Gemini 3.5 Live Translate 的核心,是把翻譯做成連續流,而不是等一句話講完再處理。Google 說模型會自動辨識 70+ 語言,並盡量保留語氣、速度和音高,讓輸出聽起來更像現場口譯。

這次的分發路徑也很清楚,Google 同步把能力放進三個面向。開發者可透過 Gemini Live API 和 Google AI Studio 試用;消費端會先在 Google Translate 的 Android 與 iOS App 上線;企業端則從 Meet 開始。
Google 也補上一個 Android listening mode,讓翻譯音訊直接從手機聽筒輸出。這類設計看起來很小,但對通話、會議、教學和現場播報都很實用,因為它把「翻譯」從一個功能變成可直接插入流程的音訊層。
- 開發者可先在 Live API 與 AI Studio 內測語音翻譯流程。
- 企業客戶會先在 Meet 看到多語會議翻譯。
- 一般用戶則會在 Translate App 先碰到這項能力。
- Google 也強調模型可處理噪音環境與多語混用,不必手動切換設定。
為什麼重要
對開發者來說,這次最直接的價值是少碰一層基礎設施。Google 點名 Agora、Fishjam、LiveKit、Pipecat 和 Vision Agents 等合作夥伴,意思很明確:產品團隊可以把時間花在體驗、權限、延遲控制和場景整合,而不是從零處理即時媒體管線。
對產業端來看,Meet 的更新更有指標性。Google 表示,翻譯支援會從 5 種語言擴到 70+,語言對應也會從英文為主的少量組合,擴到 2,000+ 組。這會直接影響跨國會議、客服中心、遠距教學,以及需要雙向口語溝通的 SaaS 產品。
Google 同時說,所有生成音訊都會加上 SynthID 浮水印。這點很重要,因為即時翻譯一旦進入電話、直播和會議場景,內容真偽與來源可追蹤性就不再是附加題,而是基本門檻。
真正的問題不是「即時翻譯能不能用」,而是它會先成為哪一個工作流程的預設層:會議、客服,還是手機通話。
下一步看什麼
接下來要觀察的不是語言數量,而是延遲、準確率和噪音場景下的穩定度。只要這三項夠穩,企業就會開始把它當成會議基礎功能,而不是額外插件。

另一個變數是定價與權限。開發者先拿到 public preview,企業端卻還在 private preview,代表 Google 仍在測試負載、成本和風險控管。這通常也意味著,真正大規模落地還要等一段時間。
如果 Google 能把這套能力穩定塞進 Meet 和 Translate,語音翻譯就會從「偶爾用的工具」變成日常預設。那時候,問題就不再是誰有翻譯器,而是誰還需要手動切語言。