[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-midjourney-public-beta-visual-generation-history-zh":3,"article-related-midjourney-public-beta-visual-generation-history-zh":29,"series-industry-93bd4b46-8be3-4118-bb94-6e230bf4bc7d":86},{"id":4,"slug":5,"title":6,"content":7,"summary":8,"source":9,"source_url":10,"author":11,"image_url":12,"cover_image":12,"category":13,"language":14,"translated_content":11,"related_article_id":15,"keywords":16,"key_takeaways":11,"views":26,"created_at":27,"published_at":28,"topic_cluster_id":11},"93bd4b46-8be3-4118-bb94-6e230bf4bc7d","midjourney-public-beta-visual-generation-history-zh","Midjourney公測背後的視覺生成史","\u003Cp>7 月，\u003Ca href=\"https:\u002F\u002Fwww.midjourney.com\" target=\"_blank\" rel=\"noopener\">Midjourney\u003C\u002Fa> 進入公測。它沒有先做傳統 App。它把入口放進 \u003Ca href=\"https:\u002F\u002Fdiscord.com\" target=\"_blank\" rel=\"noopener\">Discord\u003C\u002Fa>。這招很狠。使用者不是對著空白畫布發呆，而是在公開頻道看別人一直生圖、改圖、再生圖。\u003C\u002Fp>\u003Cp>這種做法讓圖像生成變成社交內容。也讓 Midjourney 的審美很快被記住。它不追求死板還原。它更像把「好看」直接寫進預設值裡。說真的，這東西蠻猛的。\u003C\u002Fp>\u003Cp>如果把視角拉遠，Midjourney 只是最新一段。從規則繪圖，到 GAN，再到擴散模型，視覺生成已經走了 70 多年。今天你按幾下就出圖，背後其實是好幾代研究和產品設計疊出來的結果。\u003C\u002Fp>\u003Ch2>Midjourney 為什麼先贏在 Discord\u003C\u002Fh2>\u003Cp>Midjourney 早期沒有把心力放在獨立客戶端。它直接選了 Discord。這讓使用門檻低很多。你不用先學一堆介面。你只要會打提示詞，就能開始玩。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1775171757169-olq5.png\" alt=\"Midjourney公測背後的視覺生成史\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>更重要的是，生成過程本身變成內容。你發一句 prompt，幾秒後拿到四張圖。接著可以放大、做變體、重抽。整套流程很適合被圍觀。這種公開感，讓產品自己幫自己傳播。\u003C\u002Fp>\u003Cp>它的審美策略也很明確。Midjourney 不太像照片修復工具。它比較像概念設計機。高對比、強光影、細節多、構圖滿。普通人一看就覺得「有料」。設計師也容易拿來當靈感底稿。\u003C\u002Fp>\u003Cp>這種路線，跟很多只拼寫實度的工具不同。它不是只求像。它要的是可分享。這差很多。\u003C\u002Fp>\u003Cul>\u003Cli>入口在 Discord，學習成本低\u003C\u002Fli>\u003Cli>生成過程公開，天然有傳播效果\u003C\u002Fli>\u003Cli>結果偏藝術化，不只追求寫實\u003C\u002Fli>\u003Cli>V-series 後風格更穩，辨識度更高\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>從規則繪圖到擴散模型\u003C\u002Fh2>\u003Cp>視覺生成不是近幾年才冒出來。很早以前，研究者就想讓電腦自己畫圖。只是那時的方法比較像手寫規則。你指定線條、幾何、變形。電腦能做，但很難畫出有內容感的圖。\u003C\u002Fp>\u003Cp>真正把這條路推進到實用層級的，是深度學習。2014 年，Ian Goodfellow 提出 \u003Ca href=\"https:\u002F\u002Farxiv.org\u002Fabs\u002F1406.2661\" target=\"_blank\" rel=\"noopener\">GAN\u003C\u002Fa>。那時生成圖像第一次有了更強的真實感。後來，擴散模型接手高品質生成任務。\u003Ca href=\"https:\u002F\u002Fopenai.com\u002Findex\u002Fdall-e-2\u002F\" target=\"_blank\" rel=\"noopener\">OpenAI 的 DALL·E 2\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fstability.ai\u002Fstable-diffusion\" target=\"_blank\" rel=\"noopener\">Stability AI 的 Stable Diffusion\u003C\u002Fa>，把文字到圖像帶到更多人手上。\u003C\u002Fp>\u003Cp>Midjourney 的差異，不是它發明了生成圖像。它是把模型輸出包成穩定的審美體驗。很多模型能生出「正確」的圖。Midjourney 更擅長生出「願意發出去」的圖。這就是產品層的差別。\u003C\u002Fp>\u003Cblockquote>“The future of AI is not about replacing humans, it’s about amplifying human creativity.” — David Holz\u003C\u002Fblockquote>\u003Cp>這句話很常被拿來講 Midjourney 的產品哲學。它沒有把自己包裝成設計師殺手。它更像在說，工具可以幫你更快做出畫面。重點是放大創意，不是取代人。\u003C\u002Fp>\u003Cp>也因為這樣，它會先優化風格、構圖、整體觀感。不是先追求每個像素都像照片。這條路很務實，也很符合一般創作者的使用習慣。\u003C\u002Fp>\u003Ch2>四個節點看視覺生成怎麼演進\u003C\u002Fh2>\u003Cp>如果把視覺生成史壓成幾個節點，會清楚很多。每一代技術都在補前一代的洞。使用者感受到的，通常不是演算法名詞，而是結果夠不夠好用。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1775171754897-kv2h.png\" alt=\"Midjourney公測背後的視覺生成史\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>先看幾個數字。\u003Ca href=\"https:\u002F\u002Farxiv.org\u002Fabs\u002F1406.2661\" target=\"_blank\" rel=\"noopener\">GAN 论文\u003C\u002Fa>在 2014 年發表。\u003Ca href=\"https:\u002F\u002Fopenai.com\u002Findex\u002Fdall-e-2\u002F\" target=\"_blank\" rel=\"noopener\">DALL·E 2\u003C\u002Fa> 在 2022 年把文字生成圖像推高一階。\u003Ca href=\"https:\u002F\u002Fstability.ai\u002Fstable-diffusion\" target=\"_blank\" rel=\"noopener\">Stable Diffusion\u003C\u002Fa> 同年開源後，迅速進入本地部署和第三方軟體。\u003Ca href=\"https:\u002F\u002Fwww.midjourney.com\" target=\"_blank\" rel=\"noopener\">Midjourney\u003C\u002Fa> 則用 Discord 先做社群，再做產品。\u003C\u002Fp>\u003Cp>這條線很清楚。先有生成能力。再有大規模可用性。最後才是產品分發。很多團隊卡住的地方，不是模型不夠強，而是沒有把模型變成每天會打開的工具。\u003C\u002Fp>\u003Cul>\u003Cli>2014：GAN 讓生成圖像更像真的\u003C\u002Fli>\u003Cli>2022：DALL·E 2 把文字轉圖像推到更高品質\u003C\u002Fli>\u003Cli>2022：Stable Diffusion 開源後快速擴散\u003C\u002Fli>\u003Cli>Midjourney：把 Discord 社群當成產品入口\u003C\u002Fli>\u003C\u002Ful>\u003Cp>這也說明一件事。視覺生成的競爭，早就不只是誰的模型分數高。更重要的是，誰能把能力變成使用者每天都會碰到的工作流。這點 Midjourney 做得很早。\u003C\u002Fp>\u003Ch2>OpenAI 為何讓 Sora 先停在展示\u003C\u002Fh2>\u003Cp>這裡提到 \u003Ca href=\"https:\u002F\u002Fopenai.com\u002Fsora\" target=\"_blank\" rel=\"noopener\">Sora\u003C\u002Fa>，不是在講圖片。是在講影片。OpenAI 公開展示 Sora 時，重點放在長時間一致性、複雜場景、鏡頭運動。外界第一次很直觀地看到，影片生成已經不只是短片 demo。\u003C\u002Fp>\u003Cp>但影片比圖片難太多。圖片只要一瞬間成立。影片要在時間軸上都對。人物不能突然變臉。物體不能亂跳。光線和運動也要合理。這比生一張漂亮圖麻煩很多。\u003C\u002Fp>\u003Cp>所以 Midjourney 和 Sora 的問題不同。Midjourney 處理的是靜態圖的審美穩定性。Sora 處理的是動態世界的邏輯一致性。前者回答「好不好看」。後者回答「會不會動，而且動得通」。\u003C\u002Fp>\u003Cp>對產品來說，這也是一個分水嶺。生成式 AI 已經不是只比參數。現在比的是工作流。誰能讓創作者真的拿去用，誰才有機會變成日常工具。\u003C\u002Fp>\u003Ch2>誰會更吃香\u003C\u002Fh2>\u003Cp>接下來有競爭力的產品，不一定是最像真的那個。它可能是最適合某個場景的那個。Midjourney 證明了審美一致性和社群傳播很有用。Sora 則提醒大家，影片生成的門檻高很多。\u003C\u002Fp>\u003Cp>對\u003Ca href=\"\u002Fnews\u002Fmistral-voxtral-tts-open-source-voice-ai-zh\">開發者\u003C\u002Fa>和產品經理來說，判斷標準很現實。模型能力只是起點。入口設計、回饋速度、審美策略、版權邊界、工作流整合，全部都會影響結果。只丟 API 出來，通常不夠。\u003C\u002Fp>\u003Cp>如果你想看下一波視覺生成產品誰會跑出來，可以盯這些點：\u003C\u002Fp>\u003Cul>\u003Cli>生成結果是否穩定，不是只看單次驚豔\u003C\u002Fli>\u003Cli>是否容易分享，社群傳播效率高不高\u003C\u002Fli>\u003Cli>能不能塞進設計、廣告、短影音和電商流程\u003C\u002Fli>\u003Cli>對風格控制和版權風險處理得好不好\u003C\u002Fli>\u003C\u002Ful>\u003Cp>Midjourney 的故事很直接。生成式 AI 的勝負手，常常不在模型表格裡，而在第一眼看到的那張圖。下一階段，誰能把「好看、可控、可重複使用」一起做好，誰就更接近真正的工作入口。問題已經不是圖能不能生，而是誰會把生成結果變成標準流程。\u003C\u002Fp>\u003Ch2>背景其實比產品更早\u003C\u002Fh2>\u003Cp>很多人以為 AI 生圖是這幾年才冒出來。其實不是。早期的電腦圖學，重點在幾何、渲染、規則。那時候的工具很硬。你得知道怎麼描述形狀。它不是給一般人玩的。\u003C\u002Fp>\u003Cp>後來深度學習改變了玩法。模型開始學\u003Ca href=\"\u002Fnews\u002Fdesigning-data-intensive-apps-scale-reliability-zh\">資料\u003C\u002Fa>分布。它不再只是照規則畫。它會從大量圖像裡學出風格、結構、物件關係。這讓「用語言描述畫面」變得可行。這\u003Ca href=\"\u002Fnews\u002Fmetaverse-stage-in-internet-history-zh\">一步\u003C\u002Fa>很大。\u003C\u002Fp>\u003Cp>台灣開發者如果看這條線，會發現一件很現實的事。真正值錢的，不一定是單一模型。常常是模型、介面、社群、資料流程一起配好。這也是為什麼很多工具明明模型不差，卻還是紅不起來。\u003C\u002Fp>\u003Ch2>下一波比的是工作流\u003C\u002Fh2>\u003Cp>我覺得接下來 12 到 24 個月，會更像工作流大戰。單純比誰圖漂亮，已經不夠了。大家會開始比誰能接進設計軟體、剪輯流程、廣告素材流程，甚至電商上架流程。\u003C\u002Fp>\u003Cp>如果你是開發者，現在很適合盯三件事。第一，模型輸出是否穩。第二，介面是否夠快。第三，能不能把生成結果接到真實任務。這三件事，比單純追新模型更重要。\u003C\u002Fp>\u003Cp>說白了，Midjourney 的成功不是只靠模型。它把生成圖這件事，做成一種人人看得懂的互動。這才是最值得學的地方。下一個跑出來的產品，可能不一定長得像 Midjourney，但一定會更懂怎麼讓人一直用下去。\u003C\u002Fp>","Midjourney 透過 Discord 公測走紅，也把圖像生成帶進社交式互動。這篇文章回顧從 GAN、DALL·E 2 到 Stable Diffusion 的技術脈絡，拆解它怎麼改寫視覺生成的傳播方式。","zhuanlan.zhihu.com","https:\u002F\u002Fzhuanlan.zhihu.com\u002Fp\u002F2020798020871042635",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1775171757169-olq5.png","industry","zh","7e97034b-97b7-4bd6-86dd-c0267fefd4ed",[17,18,19,20,21,22,23,24,25],"Midjourney","Discord","視覺生成","生成式AI","擴散模型","GAN","Stable Diffusion","DALL·E 2","Sora",5,"2026-04-02T23:15:37.021193+00:00","2026-04-02T23:15:36.869+00:00",{"tags":30,"relatedLang":45,"relatedPosts":49},[31,32,34,36,38,40,41,43],{"name":19,"slug":19},{"name":25,"slug":33},"sora",{"name":17,"slug":35},"midjourney",{"name":22,"slug":37},"gan",{"name":18,"slug":39},"discord",{"name":21,"slug":21},{"name":20,"slug":42},"生成式ai",{"name":24,"slug":44},"dalle-2",{"id":15,"slug":46,"title":47,"language":48},"midjourney-public-beta-visual-generation-history-en","Midjourney公测背后的视觉生成史","en",[50,56,62,68,74,80],{"id":51,"slug":52,"title":53,"cover_image":54,"image_url":54,"created_at":55,"category":13},"944aacaa-7f1b-4a11-8390-768b2a89c607","anthropic-partner-network-enterprise-ready-zh","Anthropic 讓夥伴網路變企業級","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780524191103-89dy.png","2026-06-03T22:02:45.952347+00:00",{"id":57,"slug":58,"title":59,"cover_image":60,"image_url":60,"created_at":61,"category":13},"fc8eafb2-1d73-468c-a784-1279f4732ea2","7-build-2026-announcements-for-microsoft-watchers-zh","7 個 Build 2026 觀察重點","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780523288803-hs3b.png","2026-06-03T21:47:43.306492+00:00",{"id":63,"slug":64,"title":65,"cover_image":66,"image_url":66,"created_at":67,"category":13},"6d2568ba-f5d3-41b3-8111-9fe820613e84","why-microsoft-new-ai-models-break-openai-dependence-zh","為什麼微軟自建 AI 模型，才是擺脫 OpenAI 依賴的正確路線","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780522384832-8cbv.png","2026-06-03T21:32:24.837196+00:00",{"id":69,"slug":70,"title":71,"cover_image":72,"image_url":72,"created_at":73,"category":13},"e9a0851d-34e0-46c8-8ec0-661de6e628bc","nike-mcdonalds-sneaker-drop-desert-hunt-zh","為什麼 Nike 和 McDonald’s 把球鞋發表做成沙漠尋寶","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780512474179-wpn9.png","2026-06-03T18:47:23.262279+00:00",{"id":75,"slug":76,"title":77,"cover_image":78,"image_url":78,"created_at":79,"category":13},"c09600da-ac41-403d-b17a-b44c61d4b4c8","hartenstein-knicks-quote-clean-recap-zh","Hartenstein 這句話怎麼拆成乾淨 recap","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780509792468-kdul.png","2026-06-03T18:02:47.679684+00:00",{"id":81,"slug":82,"title":83,"cover_image":84,"image_url":84,"created_at":85,"category":13},"fbeae011-dff8-4a96-935b-8c85fbbfb95a","why-thunder-should-keep-isaiah-hartenstein-zh","為什麼雷霆應該留下 Isaiah Hartenstein","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780508870211-j7jr.png","2026-06-03T17:47:23.43928+00:00",[87,92,97,102,107,112,117,122,127,132],{"id":88,"slug":89,"title":90,"created_at":91},"ee073da7-28b3-4752-a319-5a501459fb87","ai-in-2026-what-actually-matters-now-zh","2026 AI 真正重要的事","2026-03-26T07:09:12.008134+00:00",{"id":93,"slug":94,"title":95,"created_at":96},"83bd1795-8548-44c9-9a7e-de50a0923f71","trump-ai-framework-power-speech-state-preemption-zh","川普 AI 框架瞄準電力、言論與州權","2026-03-26T07:12:18.695466+00:00",{"id":98,"slug":99,"title":100,"created_at":101},"ea6be18b-c903-4e54-97b7-5f7447a612e0","nvidia-gtc-2026-big-ai-announcements-zh","NVIDIA GTC 2026 重點拆解","2026-03-26T07:14:26.62638+00:00",{"id":103,"slug":104,"title":105,"created_at":106},"4bcec76f-4c36-4daa-909f-54cd702f7c93","claude-users-spreading-out-and-getting-better-zh","Claude 用戶更分散，也更會用","2026-03-26T07:22:52.325888+00:00",{"id":108,"slug":109,"title":110,"created_at":111},"bd903b15-2473-4178-9789-b7557816e535","openclaw-raises-hard-question-for-ai-models-zh","OpenClaw 逼問 AI 模型價值","2026-03-26T07:24:54.707486+00:00",{"id":113,"slug":114,"title":115,"created_at":116},"eeac6b9e-ad9d-4831-8eec-8bba3f9bca6a","gap-google-gemini-checkout-fashion-search-zh","Gap 把結帳搬進 Gemini","2026-03-26T07:28:23.937768+00:00",{"id":118,"slug":119,"title":120,"created_at":121},"0740e53f-605d-4d57-8601-c10beb126f3c","google-pushes-gemini-transition-to-march-2026-zh","Google 把 Gemini 轉換延到 2026 年 3…","2026-03-26T07:30:12.825269+00:00",{"id":123,"slug":124,"title":125,"created_at":126},"e660d801-2421-4529-8fa9-86b82b066990","metas-llama-4-benchmark-scandal-gets-worse-zh","Meta Llama 4 分數風波又擴大","2026-03-26T07:34:21.156421+00:00",{"id":128,"slug":129,"title":130,"created_at":131},"183f9e7c-e143-40bb-a6d5-67ba84a3a8bc","accenture-mistral-ai-sovereign-enterprise-deal-zh","Accenture 攜手 Mistral AI 賣主權 AI","2026-03-26T07:38:14.818906+00:00",{"id":133,"slug":134,"title":135,"created_at":136},"191d9b1b-768a-478c-978c-dd7431a38149","mistral-ai-faces-its-hardest-year-yet-zh","Mistral AI 迎來最硬的一年","2026-03-26T07:40:23.716374+00:00"]