標籤
video generation
影片生成正在從「會動」走向「可控、可解釋」:研究重點包括時間一致性、速度與節奏控制、相機與物件運動分離,以及主動/被動動作建模,讓生成結果更接近真實世界的因果關係與使用者意圖。
8 篇文章

工具應用/6月12日
Midjourney 2026 定價:月費與 GPU 時數
Midjourney 2026 月費從 10 美元到 120 美元,實際成本取決於 GPU 時數、Fast/Relax/Turbo 與影片生成用量。

產業動態/6月2日
4 個 Gemini 為何很快碰到上限的原因
4 個 Gemini 很快撞上使用上限的原因,並整理 Google 對新計算量限制的回應。

技術研究/6月1日
Lumos-Nexus 讓影片生成先訓練、後精修
Lumos-Nexus 把訓練和推理解耦,讓影片生成先學理解再交給高容量預訓練生成器補畫質,兼顧推理控制與視覺品質。

技術研究/5月16日
RefDecoder 讓影片解碼器吃參考圖
RefDecoder 把參考圖直接送進影片解碼器,補上傳統流程只在去噪端做條件控制的缺口,目標是提升重建細節、一致性與可用性。

技術研究/5月16日
EntityBench 盯住長片一致性
EntityBench 用長篇多鏡頭影片做一致性測試,檢查角色、物件與場景能不能跨鏡頭維持同一性,也提出帶記憶的基線方法 EntityMem。

技術研究/5月8日
ActCam 讓鏡頭和動作一起控
ActCam 用零樣本方式,同時控制影片生成中的角色動作與攝影機路徑,重點是不必重新訓練新模型。

工具應用/5月7日
2026 如何遷移 Sora 2
把 Sora 2 的影片工作流遷移到新模型,並在 OpenAI 停用期限前完成備份、測試與替換。

技術研究/4月9日
MoRight 讓影片控制更有因果感
MoRight 把相機運動和物件運動拆開,還把動作分成主動與被動兩段,讓影片生成不只會動,還能更像真的有因果關係。