標籤

video generation

影片生成正在從「會動」走向「可控、可解釋」：研究重點包括時間一致性、速度與節奏控制、相機與物件運動分離，以及主動／被動動作建模，讓生成結果更接近真實世界的因果關係與使用者意圖。

8 篇文章

Midjourney 2026 定價：月費與 GPU 時數

Midjourney 2026 月費從 10 美元到 120 美元，實際成本取決於 GPU 時數、Fast/Relax/Turbo 與影片生成用量。

4 個 Gemini 很快撞上使用上限的原因，並整理 Google 對新計算量限制的回應。

Lumos-Nexus 把訓練和推理解耦，讓影片生成先學理解再交給高容量預訓練生成器補畫質，兼顧推理控制與視覺品質。

RefDecoder 把參考圖直接送進影片解碼器，補上傳統流程只在去噪端做條件控制的缺口，目標是提升重建細節、一致性與可用性。

EntityBench 用長篇多鏡頭影片做一致性測試，檢查角色、物件與場景能不能跨鏡頭維持同一性，也提出帶記憶的基線方法 EntityMem。

ActCam 用零樣本方式，同時控制影片生成中的角色動作與攝影機路徑，重點是不必重新訓練新模型。

把 Sora 2 的影片工作流遷移到新模型，並在 OpenAI 停用期限前完成備份、測試與替換。

MoRight 把相機運動和物件運動拆開，還把動作分成主動與被動兩段，讓影片生成不只會動，還能更像真的有因果關係。