Gemini 3.5 Live Translate 擴至70+語言

[MODEL] 2026年6月15日4 分鐘閱讀OraCore 編輯部

Google 推出 Gemini 3.5 Live Translate，支援 70+ 語言、延遲僅數秒，並同步開放給開發者、Meet 與 Google Translate。

Google 推出 Gemini 3.5 Live Translate，支援 70+ 語言的近即時語音翻譯，並開始向開發者、Meet 和手機 App 分批開放。

Google 在 2026 年 6 月 9 日發布 Gemini 3.5 Live Translate，主打 speech-to-speech 即時翻譯。這次不是單純做文字轉譯，而是讓譯文跟著說話者節奏走，延遲只剩幾秒。

官方同時丟出幾個關鍵數字：支援 70+ 語言、Meet 內可對應 2,000+ 語言組合、開發者可用 public preview，Google Meet 則會在本月進入 private preview。對做語音產品的人來說，這代表 Google 正把即時翻譯從 demo 推向可用功能。

項目	數值
Languages supported	70+
Language combinations in Meet	2,000+
Developer access	Public preview
Google Meet access	Private preview this month
Translation delay	Just a few seconds behind speaker

發生了什麼

每週精選模型發布、工具應用與深度分析，直送信箱。不定期，不騷擾。

不會寄垃圾信，隨時可取消。

Gemini 3.5 Live Translate 的核心，是把翻譯做成連續流，而不是等一句話講完再處理。Google 說模型會自動辨識 70+ 語言，並盡量保留語氣、速度和音高，讓輸出聽起來更像現場口譯。

這次的分發路徑也很清楚，Google 同步把能力放進三個面向。開發者可透過 Gemini Live API 和 Google AI Studio 試用；消費端會先在 Google Translate 的 Android 與 iOS App 上線；企業端則從 Meet 開始。

Google 也補上一個 Android listening mode，讓翻譯音訊直接從手機聽筒輸出。這類設計看起來很小，但對通話、會議、教學和現場播報都很實用，因為它把「翻譯」從一個功能變成可直接插入流程的音訊層。

對開發者來說，這次最直接的價值是少碰一層基礎設施。Google 點名 Agora、Fishjam、LiveKit、Pipecat 和 Vision Agents 等合作夥伴，意思很明確：產品團隊可以把時間花在體驗、權限、延遲控制和場景整合，而不是從零處理即時媒體管線。

對產業端來看，Meet 的更新更有指標性。Google 表示，翻譯支援會從 5 種語言擴到 70+，語言對應也會從英文為主的少量組合，擴到 2,000+ 組。這會直接影響跨國會議、客服中心、遠距教學，以及需要雙向口語溝通的 SaaS 產品。

Google 同時說，所有生成音訊都會加上 SynthID 浮水印。這點很重要，因為即時翻譯一旦進入電話、直播和會議場景，內容真偽與來源可追蹤性就不再是附加題，而是基本門檻。

真正的問題不是「即時翻譯能不能用」，而是它會先成為哪一個工作流程的預設層：會議、客服，還是手機通話。

接下來要觀察的不是語言數量，而是延遲、準確率和噪音場景下的穩定度。只要這三項夠穩，企業就會開始把它當成會議基礎功能，而不是額外插件。

另一個變數是定價與權限。開發者先拿到 public preview，企業端卻還在 private preview，代表 Google 仍在測試負載、成本和風險控管。這通常也意味著，真正大規模落地還要等一段時間。

如果 Google 能把這套能力穩定塞進 Meet 和 Translate，語音翻譯就會從「偶爾用的工具」變成日常預設。那時候，問題就不再是誰有翻譯器，而是誰還需要手動切語言。

// 相關文章