[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-gemini-omni-video-review-text-rendering-zh":3,"article-related-gemini-omni-video-review-text-rendering-zh":32,"series-model-release-b1da56ac-8019-4c6b-a8dc-22e6e22b1cb5":83},{"id":4,"slug":5,"title":6,"content":7,"summary":8,"source":9,"source_url":10,"author":11,"image_url":12,"cover_image":12,"category":13,"language":14,"translated_content":11,"related_article_id":15,"keywords":16,"key_takeaways":24,"views":28,"created_at":29,"published_at":30,"topic_cluster_id":31},"b1da56ac-8019-4c6b-a8dc-22e6e22b1cb5","gemini-omni-video-review-text-rendering-zh","Gemini Omni 影片模型怎麼了","\u003Cp data-speakable=\"summary\">\u003Ca href=\"\u002Ftag\u002Fgemini\">Gemini\u003C\u002Fa> Omni 是 \u003Ca href=\"\u002Ftag\u002Fgoogle\">Google\u003C\u002Fa> 外流的影片模型，主打影片文字渲染強，還能在聊天內直接改片。\u003C\u002Fp>\u003Cp>說真的，這東西蠻有意思。外流測試發生在 Google I\u002FO 2026 前幾天。畫面、提示詞、對照結果都被放出來了。重點很直接：\u003Ca href=\"https:\u002F\u002Fgemini.google.com\" target=\"_blank\" rel=\"noopener\">Gemini\u003C\u002Fa> Omni 在影片裡顯示文字，比 \u003Ca href=\"https:\u002F\u002Fwww.seedance.ai\" target=\"_blank\" rel=\"noopener\">Seedance 2.0\u003C\u002Fa> 和 \u003Ca href=\"https:\u002F\u002Fklingai.com\" target=\"_blank\" rel=\"noopener\">Kling 3.0\u003C\u002Fa> 更穩。它還加了聊天室內編輯，這點不少工具還做不到。\u003C\u002Fp>\u003Cp>如果你做教學片、產品示範，或任何有字的畫面，這能力很實用。因為 \u003Ca href=\"\u002Fnews\u002Fwhy-microsoft-should-stop-betting-ai-on-openai-zh\">AI\u003C\u002Fa> 影片最常翻車的地方，不是人物走路。是字會歪掉、糊掉，甚至直接消失。這次外流剛好打到痛點。\u003C\u002Fp>\u003Ctable>\u003Cthead>\u003Ctr>\u003Cth>項目\u003C\u002Fth>\u003Cth>Gemini Omni\u003C\u002Fth>\u003Cth>Seedance 2.0\u003C\u002Fth>\u003Cth>Kling 3.0\u003C\u002Fth>\u003C\u002Ftr>\u003C\u002Fthead>\u003Ctbody>\u003Ctr>\u003Ctd>文字渲染\u003C\u002Ftd>\u003Ctd>測試最佳\u003C\u002Ftd>\u003Ctd>約 3 秒內開始壞掉\u003C\u002Ftd>\u003Ctd>表現較弱\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>聊天室內編輯\u003C\u002Ftd>\u003Ctd>有\u003C\u002Ftd>\u003Ctd>沒有\u003C\u002Ftd>\u003Ctd>沒有\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>每日配額影響\u003C\u002Ftd>\u003Ctd>2 支影片吃掉 86%\u003C\u002Ftd>\u003Ctd>一般使用\u003C\u002Ftd>\u003Ctd>一般使用\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>公開可用性\u003C\u002Ftd>\u003Ctd>尚未\u003C\u002Ftd>\u003Ctd>已可用\u003C\u002Ftd>\u003Ctd>已可用\u003C\u002Ftd>\u003C\u002Ftr>\u003C\u002Ftbody>\u003C\u002Ftable>\u003Ch2>Gemini Omni 到底是什麼\u003C\u002Fh2>\u003Cp>Gemini Omni 是 Google 放進 \u003Ca href=\"https:\u002F\u002Fgemini.google.com\" target=\"_blank\" rel=\"noopener\">Gemini app\u003C\u002Fa> 的整合式影片生成和編輯模型。它走的是聊天式流程。你先丟文字生成影片，再在同一串對話裡改片。也能用模板重混，或替換畫面中的物件。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778779280109-lrrk.png\" alt=\"Gemini Omni 影片模型怎麼了\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>講白了，Google 想把「生片」和「改片」塞進同一個介面。這種設計很現實。因為多數影片工具還是把建立和編輯拆成兩個產品。使用者要切來切去，流程很煩。\u003C\u002Fp>\u003Cp>外流內容也顯示，它很可能在正式發表前就先露面。這很 Google。功能常常先跑進公開介面，再慢慢補說明。這次剛好卡在 \u003Ca href=\"https:\u002F\u002Fblog.google\u002Ftechnology\u002Fai\u002Fgoogle-io\u002F\" target=\"_blank\" rel=\"noopener\">Google I\u002FO\u003C\u002Fa> 2026 前夕，時間點很微妙。\u003C\u002Fp>\u003Cul>\u003Cli>可直接在聊天內生成影片\u003C\u002Fli>\u003Cli>可做物件替換與浮水印移除\u003C\u002Fli>\u003Cli>可用模板把素材重混成不同版本\u003C\u002Fli>\u003Cli>生成和修改都留在同一串對話\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>為什麼文字渲染最重要\u003C\u002Fh2>\u003Cp>AI 影片模型可以讓人走路、坐下、轉頭。這些都還算能看。真正難的是，畫面裡的字要一直保持可讀。只要鏡頭一動，字母、間距、筆畫就很容易崩。\u003C\u002Fp>\u003Cp>這次最清楚的 demo，是一位教授在黑板上寫三角函數公式。模型把公式撐住了。像 sin²(x) + cos²(x) = 1 這種內容，還能維持到可讀。人物動作和粉筆痕跡也沒有亂掉。\u003C\u002Fp>\u003Cblockquote>“Generative video models are hitting a ceiling on temporal coherence, and text is one of the first places that ceiling shows up.” — Rowan Cheung, \u003Ca href=\"https:\u002F\u002Fwww.theaivalley.com\" target=\"_blank\" rel=\"noopener\">The Rundown AI\u003C\u002Fa> 創辦人\u003C\u002Fblockquote>\u003Cp>這句話很準。影片模型卡住的地方，常常先出現在文字。不是臉不夠像，而是字撐不住時間軸。Gemini Omni 看起來像是先把文字當語言問題處理，再轉成視覺問題。\u003C\u002Fp>\u003Cp>Seedance 2.0 的對照就很明顯。它一開始還行，但幾秒後公式就亂了。Kling 3.0 在同樣比較裡更差。這就是為\u003Ca href=\"\u002Fnews\u002Fwhy-buns-zig-to-rust-experiment-is-right-zh\">什麼\u003C\u002Fa>黑板片段很重要。它不是秀肌肉而已。它直接測出模型能不能用在教學、簡報、產品說明。\u003C\u002Fp>\u003Cul>\u003Cli>文字穩定度，決定能不能做教學片\u003C\u002Fli>\u003Cli>可讀字幕，決定能不能做產品示範\u003C\u002Fli>\u003Cli>符號和公式，最容易抓出模型弱點\u003C\u002Fli>\u003Cli>字撐得住，影片才有實用價值\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>聊天室內編輯，才是 Google 能收費的地方\u003C\u002Fh2>\u003Cp>文字渲染會吸睛，但編輯功能才可能變成商業重點。外流內容顯示，Gemini Omni 有三種編輯模式：物件替換、浮水印移除、模板式重混。這些都不是單純修圖而已。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778779265407-g1p9.png\" alt=\"Gemini Omni 影片模型怎麼了\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>有個 demo 把海邊餐桌上的義大利麵，換成泰式湯品。燈光、人物位置、桌面關係還能維持。這代表模型不只是在換一個物件。它還要理解那個物件跟整個場景怎麼互動。\u003C\u002Fp>\u003Cp>另一個 demo 是把 \u003Ca href=\"https:\u002F\u002Fopenai.com\u002Fsora\" target=\"_blank\" rel=\"noopener\">Sora\u003C\u002Fa> 生成影片上的浮水印移掉。這件事很實際。如果正式版也能做到，Gemini Omni 就不只是生成器。它會變成一層後製工具。Google 很可能想卡這個位置。\u003C\u002Fp>\u003Cul>\u003Cli>物件替換要維持場景連貫\u003C\u002Fli>\u003Cli>浮水印移除可處理第三方輸出\u003C\u002Fli>\u003Cli>模板可把原始片段變成固定格式\u003C\u002Fli>\u003Cli>整個流程都在同一串聊天裡完成\u003C\u002Fli>\u003C\u002Ful>\u003Cp>這種流程差很多。你不用開一堆軟體。先叫它生一支，再要求改道具，再來一版。對創作者來說，省下的不是一分鐘而已，是整個切換成本。\u003C\u002Fp>\u003Ch2>跟 Seedance 2.0、Kling 3.0 比起來怎樣\u003C\u002Fh2>\u003Cp>從外流測試看，Gemini Omni 在有文字的場景很強。這點很明確。但如果拉到其他類型，優勢就沒那麼乾脆。Seedance 2.0 在吃東西、食物移動這類畫面上更穩。Kling 3.0 則是在文字和整體一致性上都比較弱。\u003C\u002Fp>\u003Cp>所以實際上可以這樣切。你要做教學、標示、字幕很多的內容，Gemini Omni 比較適合。你要拍食物、料理、物理互動，Seedance 2.0 可能更安全。這不是誰比較潮的問題，是誰比較不會翻車。\u003C\u002Fp>\u003Cp>如果是旅遊、生活、產品影片，差距可能沒那麼大。這時候價格、配額、開放時間就比畫質更重要。說白了，Google 如果把門開太小，模型再強也只是 demo。\u003C\u002Fp>\u003Cul>\u003Cli>Gemini Omni：文字最好，編輯強，安全限制也多\u003C\u002Fli>\u003Cli>Seedance 2.0：食物動作較穩，文字較弱\u003C\u002Fli>\u003Cli>Kling 3.0：在這次測試裡整體較弱\u003C\u002Fli>\u003Cli>對多數人來說，配額可能比畫質更重要\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>它還有哪些明顯短板\u003C\u002Fh2>\u003Cp>餐桌那個測試也暴露了老問題：食物物理還是不太行。影片裡的義大利麵會出現、消失、又再出現。人看起來是自然的，但盤子上的東西不穩。\u003C\u002Fp>\u003Cp>這不是 Google 才有的毛病。吃東西本來就是 AI 影片很難的題目。因為它要同時追蹤物件變形、材質變化、還有每一幀的狀態。Seedance 2.0 在這裡反而更好，所以食物創作者別急著站隊。\u003C\u002Fp>\u003Cp>安全層也帶來摩擦。外流測試的人不能直接用完整的「Will Smith eating sp\u003Ca href=\"\u002Fnews\u002Fwei-shen-me-microsoft-agentic-security-beats-single-model-ai-zh\">ag\u003C\u002Fa>hetti」名稱，系統會擋。只能改成描述式提示詞。這種限制對一般用戶也許還行，但做惡搞、引用、娛樂內容的人會很煩。\u003C\u002Fp>\u003Cp>更麻煩的是配額。外流顯示，兩支影片就吃掉 86% 的 AI Pro 每日額度。如果正式版也差不多，那很多人一天只能玩幾次。尤其同一訂閱還要分給文字、圖片、程式碼工作。\u003C\u002Fp>\u003Ch2>Google I\u002FO 2026 要看什麼\u003C\u002Fh2>\u003Cp>重點不是這次外流看起來多猛。它確實猛。重點是 Google 上線時會不會給合理配額、放寬安全限制，還有定出創作者能接受的價格。\u003C\u002Fp>\u003Cp>如果 Google 把影片額度從一般 AI Pro 池子拆開，Omni 就比較像真的工作工具。如果不拆，使用者很快就會撞牆。那它最後可能只適合偶爾 demo，或內部流程用。\u003C\u002Fp>\u003Cp>我會盯三件事。第一，公開日期。第二，配額政策。第三，編輯功能會留在 Gemini 裡，還是拆成獨立產品。這三個答案，會直接決定它是日常工具，還是發表會素材。\u003C\u002Fp>\u003Cp>講白了，Gemini Omni 現在最像一個解痛點的影片模型。它不是只拼真實感。它先解決「字能不能留住」這件事。接下來就看 Google 會不會真的讓人用得夠多。\u003C\u002Fp>\u003Ch2>接下來我會怎麼看\u003C\u002Fh2>\u003Cp>如果你是開發者，先別急著只看畫面好不好看。你要問的是 \u003Ca href=\"\u002Ftag\u002Fapi\">API\u003C\u002Fa>、配額、延遲、價格，還有輸出能不能穩定重現。這些才是能不能接進產品的核心。\u003C\u002Fp>\u003Cp>如果你是內容創作者，先盯字幕、標示、教學片這三種場景。這些地方最吃文字穩定度。只要 Gemini Omni 真能把字撐住，它就會比很多只會做漂亮鏡頭的模型更實用。\u003C\u002Fp>\u003Cp>我猜 Google 會把它包得很保守。先小量開放，再慢慢放寬。你可以先把這次外流當成一個訊號。影片模型的下一場競爭，不只是誰畫面更真。是誰能把字、編輯、配額一起做好。\u003C\u002Fp>","Gemini Omni 外流測試顯示它在影片文字渲染與聊天室編輯上很強，但配額和安全限制可能讓實用性打折。","www.reviewstown.com","https:\u002F\u002Fwww.reviewstown.com\u002Fai\u002Fgemini-omni-ai-video-generation-review\u002F",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778779280109-lrrk.png","model-release","zh","68a2ba2e-f07a-4f28-a69c-24bf66652d2e",[17,18,19,20,21,22,23],"Gemini Omni","AI 影片模型","文字渲染","聊天室內編輯","Google I\u002FO 2026","Seedance 2.0","Kling 3.0",[25,26,27],"Gemini Omni 的強項是影片文字渲染，黑板和公式測試特別明顯。","它把生成和編輯放進同一個聊天流程，對創作者很省事。","配額和安全限制可能是最大阻力，兩支影片就吃掉 86% 額度。",10,"2026-05-14T17:20:42.608312+00:00","2026-05-14T17:20:42.448+00:00","0a3b4f35-7be1-430e-b708-37bdc8b5219a",{"tags":33,"relatedLang":42,"relatedPosts":46},[34,36,38,39,40],{"name":21,"slug":35},"google-io-2026",{"name":18,"slug":37},"ai-影片模型",{"name":19,"slug":19},{"name":20,"slug":20},{"name":17,"slug":41},"gemini-omni",{"id":15,"slug":43,"title":44,"language":45},"gemini-omni-video-review-text-rendering-en","Gemini Omni Video Review: Text Rendering Beats Rivals","en",[47,53,59,65,71,77],{"id":48,"slug":49,"title":50,"cover_image":51,"image_url":51,"created_at":52,"category":13},"1985ce38-03c6-4968-96fa-b751553bbef3","why-claude-opus-48-is-not-the-big-story-zh","為什麼 Claude Opus 4.8 不是大新聞","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780531367297-nrfs.png","2026-06-04T00:02:24.633987+00:00",{"id":54,"slug":55,"title":56,"cover_image":57,"image_url":57,"created_at":58,"category":13},"8810b91a-9aa2-4cd6-a58b-18fad5897423","devin-booker-sedona-mcdonalds-shoe-launch-zh","Booker把Sedona麥當勞變鞋款發表場","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780510686292-fm1k.png","2026-06-03T18:17:31.966783+00:00",{"id":60,"slug":61,"title":62,"cover_image":63,"image_url":63,"created_at":64,"category":13},"d4d7e664-cc7f-4211-a733-b7c111b86bd6","best-open-source-llms-2026-ranked-zh","2026 最佳開源 LLM 排名","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780396385004-yyka.png","2026-06-02T10:32:37.264398+00:00",{"id":66,"slug":67,"title":68,"cover_image":69,"image_url":69,"created_at":70,"category":13},"06774dfe-08eb-4a53-a8f7-36389b462c2b","llama-3-1-70b-specs-benchmarks-deployment-zh","Llama 3.1 70B：規格與部署","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780395481064-5yri.png","2026-06-02T10:17:33.072306+00:00",{"id":72,"slug":73,"title":74,"cover_image":75,"image_url":75,"created_at":76,"category":13},"e8ee6f00-cf62-41e6-83b7-92ce148fe46e","kill-bill-whole-bloody-affair-4k-blu-ray-zh","《追殺比爾：血腥全集》4K 藍光上市","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780364908972-15qn.png","2026-06-02T01:48:00.707278+00:00",{"id":78,"slug":79,"title":80,"cover_image":81,"image_url":81,"created_at":82,"category":13},"893178f1-7aba-4a0c-a3cf-1812c9d3283e","almalinux-10-2-9-8-new-stacks-zh","AlmaLinux 10.2 與 9.8 更新了什麼","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780291073047-7bxy.png","2026-06-01T05:17:27.940241+00:00",[84,89,94,99,104,109,114,119,124,129],{"id":85,"slug":86,"title":87,"created_at":88},"58b64033-7eb6-49b9-9aab-01cf8ae1b2f2","nvidia-rubin-six-chips-one-ai-supercomputer-zh","NVIDIA Rubin 把六顆晶片塞進 AI 機櫃","2026-03-26T07:18:45.861277+00:00",{"id":90,"slug":91,"title":92,"created_at":93},"0dcc2c61-c2a6-480d-adb8-dd225fc68914","march-2026-ai-model-news-what-mattered-zh","2026 年 3 月 AI 模型新聞重點","2026-03-26T07:32:08.386348+00:00",{"id":95,"slug":96,"title":97,"created_at":98},"214ab08b-5ce5-4b5c-8b72-47619d8675dd","why-small-models-are-winning-on-device-ai-zh","小模型為何吃下裝置端 AI","2026-03-26T07:36:30.488966+00:00",{"id":100,"slug":101,"title":102,"created_at":103},"785624b2-0355-4b82-adc3-de5e45eecd88","midjourney-v8-faster-images-higher-costs-zh","Midjourney V8 變快了，也變貴了","2026-03-26T07:52:03.562971+00:00",{"id":105,"slug":106,"title":107,"created_at":108},"cda76b92-d209-4134-86c1-a60f5bc7b128","xiaomi-mimo-trio-agents-robots-voice-zh","小米 MiMo 三模型瞄準代理、機器人與語音","2026-03-28T03:05:08.779489+00:00",{"id":110,"slug":111,"title":112,"created_at":113},"9e1044b4-946d-47fe-9e2a-c2ee032e1164","xiaomi-mimo-v2-pro-1t-moe-agents-zh","小米 MiMo-V2-Pro 登場：1T MoE 模型","2026-03-28T03:06:19.002353+00:00",{"id":115,"slug":116,"title":117,"created_at":118},"c4b6186f-bd84-4598-997e-c6e31d543c0d","cursor-composer-2-agentic-coding-model-zh","Cursor Composer 2 走向代理式寫碼","2026-03-28T03:13:06.422716+00:00",{"id":120,"slug":121,"title":122,"created_at":123},"e112e76f-ec3b-408f-810e-e93ae21a888a","apple-siri-gemini-distilled-models-zh","Apple Siri 牽手 Gemini 的真相","2026-03-29T04:52:57.886544+00:00",{"id":125,"slug":126,"title":127,"created_at":128},"c679b51f-194a-463b-87fc-7695256ff752","mimo-v2-pro-vs-omni-vs-flash-2026-zh","MiMo V2 Pro、Omni、Flash 怎麼選","2026-04-02T01:18:43.576128+00:00",{"id":130,"slug":131,"title":132,"created_at":133},"3b988fd7-6749-4f01-ba25-c0ad7486dc31","z-ai-glm-5v-turbo-design2code-claude-zh","GLM-5V-Turbo 在 Design2Code 贏了…","2026-04-02T04:03:36.31741+00:00"]