[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-ideogram-4-0-comfyui-first-test-en":3,"article-related-ideogram-4-0-comfyui-first-test-en":30,"series-model-release-40029ff3-361e-45f8-9641-9b6b79d9ff0c":81},{"id":4,"slug":5,"title":6,"content":7,"summary":8,"source":9,"source_url":10,"author":11,"image_url":12,"cover_image":12,"category":13,"language":14,"translated_content":11,"related_article_id":15,"keywords":16,"key_takeaways":22,"views":26,"created_at":27,"published_at":28,"topic_cluster_id":29},"40029ff3-361e-45f8-9641-9b6b79d9ff0c","ideogram-4-0-comfyui-first-test-en","Ideogram 4.0 在 ComfyUI 里的首测表现","\u003Cp data-speakable=\"summary\">\u003Ca href=\"https:\u002F\u002Fwww.ideogram.ai\u002F\" target=\"_blank\" rel=\"noopener\">Ideogram 4.0\u003C\u002Fa> 在 \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fcomfyanonymous\u002FComfyUI\" target=\"_blank\" rel=\"noopener\">ComfyUI\u003C\u002Fa> 里首测，人物年龄和外形控制比想象中更难。\u003C\u002Fp>\u003Cp>这次测试最直观的感受只有一个：提示词写得再细，模型也可能给你画出完全不同的年龄感。原始提示里写的是“An elegant European blonde woman with her hair styled in soft, sophisticated waves”，结果模型反复把她画成一位金发老妇。\u003C\u002Fp>\u003Cp>把提示词缩短成“A beautiful European blonde woman”后，画面稍微正常了一些，但依然偏老，身材也没有达到预期。这个案例很适合拿来观察 Ideogram 4.0 在人物生成上的真实表现，而不是只看官方示例图。\u003C\u002Fp>\u003Ctable>\u003Cthead>\u003Ctr>\u003Cth>项目\u003C\u002Fth>\u003Cth>测试内容\u003C\u002Fth>\u003Cth>结果\u003C\u002Fth>\u003C\u002Ftr>\u003C\u002Fthead>\u003Ctbody>\u003Ctr>\u003Ctd>模型\u003C\u002Ftd>\u003Ctd>\u003Ca href=\"https:\u002F\u002Fwww.ideogram.ai\u002F\" target=\"_blank\" rel=\"noopener\">Ideogram 4.0\u003C\u002Fa>\u003C\u002Ftd>\u003Ctd>人物细节可做，但年龄感偏差明显\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>工作流\u003C\u002Ftd>\u003Ctd>\u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fcomfyanonymous\u002FComfyUI\" target=\"_blank\" rel=\"noopener\">ComfyUI\u003C\u002Fa>\u003C\u002Ftd>\u003Ctd>可直接接入测试，适合反复改词\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>首个提示词\u003C\u002Ftd>\u003Ctd>elegant European blonde woman...\u003C\u002Ftd>\u003Ctd>经常生成金发老妇\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>简化提示词\u003C\u002Ftd>\u003Ctd>A beautiful European blonde woman\u003C\u002Ftd>\u003Ctd>有所改善，但仍偏成熟\u003C\u002Ftd>\u003C\u002Ftr>\u003C\u002Ftbody>\u003C\u002Ftable>\u003Ch2>提示词一改，年龄感就跑偏了\u003C\u002Fh2>\u003Cp>这类问题在文生图里并不少见，但 Ideogram 4.0 的表现尤其值得注意，因为它对“优雅”“柔和波浪发型”这类修饰词的理解，明显带着自己的偏好。模型没有按人类对“elegant European blonde woman”的直觉去生成，而是把“优雅”和“成熟”强绑定了。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781118196304-kz61.png\" alt=\"Ideogram 4.0 在 ComfyUI 里的首测表现\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>这说明一个现实：文生图模型并不是逐字翻译提示词，它更像是在调用训练数据里的视觉联想。你写“sophisticated waves”，它可能联想到更年长、更正式的肖像风格，而不是年轻、时尚、轻盈的女性形象。\u003C\u002Fp>\u003Cp>对做图的人来说，这种偏差会直接影响工作流。你想要的是“年轻感 + 金发 + 欧洲面孔”，模型给你的却是“成熟感 + 金发 + 肖像照气质”。\u003C\u002Fp>\u003Cul>\u003Cli>长提示词更容易把模型带进固定模板\u003C\u002Fli>\u003Cli>年龄词和气质词会互相干扰\u003C\u002Fli>\u003Cli>人物审美比单纯画质更难控制\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>ComfyUI 里的反复试错，暴露了什么\u003C\u002Fh2>\u003Cp>\u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fcomfyanonymous\u002FComfyUI\" target=\"_blank\" rel=\"noopener\">ComfyUI\u003C\u002Fa> 的价值就在这里：它让你很快看见模型到底听懂了多少。相比一次性出图，节点式工作流更适合做提示词 A\u002FB 测试，因为你能保留同一套采样、同一组参数，只改描述词。\u003C\u002Fp>\u003Cp>在这次首测里，最有意思的不是“第一次失败”，而是“改短以后稍微变好”。这通常意味着模型对核心名词的响应还行，但对修饰语的权重分配很奇怪。换句话说，它知道你在说“金发女人”，却未必知道你要的是“年轻漂亮的金发女人”。\u003C\u002Fp>\u003Cblockquote>“Text-to-image models are stochastic parrots.” — Emily M. Bender, University of Washington\u003C\u002Fblockquote>\u003Cp>这句话虽然不是专门为 Ideogram 4.0 说的，但很贴切。生成模型会复述训练数据里的模式，而不是理解你脑子里的画面。你看到的“老妇化”结果，本质上就是模型把某些词和某种年龄特征绑在了一起。\u003C\u002Fp>\u003Cp>如果你常做人物图，这种偏差会逼着你重新写提示词。与其堆砌形容词，不如先把最核心的视觉目标写清楚，再逐步补充发型、服饰和光线。\u003C\u002Fp>\u003Ch2>和常见文生图思路比，Ideogram 4.0差在哪\u003C\u002Fh2>\u003Cp>从这次测试看，Ideogram 4.0 的问题不在“画不出来”，而在“画得太有自己的想法”。它能给出完整人物，但年龄、气质和脸部审美的偏移很明显。对追求商业可控性的用户来说，这比画面噪点更麻烦。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781118197551-j7y8.png\" alt=\"Ideogram 4.0 在 ComfyUI 里的首测表现\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>如果把它和常见的图像生成流程放在一起看，差异会更清楚：\u003C\u002Fp>\u003Cul>\u003Cli>\u003Ca href=\"https:\u002F\u002Fopenai.com\u002Findex\u002Fintroducing-4o-image-generation\u002F\" target=\"_blank\" rel=\"noopener\">OpenAI 图像生成\u003C\u002Fa> 更偏向自然语义理解，适合快速得到接近需求的结果\u003C\u002Fli>\u003Cli>\u003Ca href=\"https:\u002F\u002Fstability.ai\u002F\" target=\"_blank\" rel=\"noopener\">Stability AI\u003C\u002Fa> 的 \u003Ca href=\"https:\u002F\u002Fstability.ai\u002Fnews\u002Fstable-diffusion-3\" target=\"_blank\" rel=\"noopener\">Stable Diffusion 3\u003C\u002Fa> 生态更开放，便于微调和本地部署\u003C\u002Fli>\u003Cli>\u003Ca href=\"https:\u002F\u002Fwww.ideogram.ai\u002F\" target=\"_blank\" rel=\"noopener\">Ideogram\u003C\u002Fa> 更强调风格化输出，但人物年龄控制这次不够稳定\u003C\u002Fli>\u003Cli>\u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fcomfyanonymous\u002FComfyUI\" target=\"_blank\" rel=\"noopener\">ComfyUI\u003C\u002Fa> 适合把这些差异拆开验证，而不是靠主观感觉下结论\u003C\u002Fli>\u003C\u002Ful>\u003Cp>这组对比里还有一个细节很重要：当你把提示词从长句改成短句，模型表现反而更接近预期。这说明它可能更吃“核心名词 + 少量限定词”的写法，而不是密集堆叠形容词。\u003C\u002Fp>\u003Cp>对设计师和 AI 绘图用户来说，这不是坏消息，反而是可操作的信息。你可以把提示词拆成两层，先锁定主体，再单独测试年龄、肤色、发型和镜头语言。\u003C\u002Fp>\u003Ch2>这类首测对创作者的实际意义\u003C\u002Fh2>\u003Cp>如果你做的是海报、虚拟人、广告人物图，这次测试给出的结论很直接：Ideogram 4.0 可以试，但别默认它会尊重你对“年轻”“优雅”“性感”这些词的直觉定义。它更像一个需要被反复校准的生成器，而不是一键出成片的工具。\u003C\u002Fp>\u003Cp>更现实的做法，是把它放进你的 \u003Ca href=\"\u002Fnews\u002Fcomfyui-workflows\" target=\"_blank\" rel=\"noopener\">ComfyUI 工作流\u003C\u002Fa> 里，和其他模型并排测试。你会很快知道它适合什么，不适合什么。比如它可能更适合风格化肖像，而不是严格年龄控制的人像广告图。\u003C\u002Fp>\u003Cp>如果后续版本继续优化人物一致性，Ideogram 的吸引力会明显上升。可在现在这个阶段，真正决定结果的，还是提示词写法、参数稳定性和你能接受多少试错成本。\u003C\u002Fp>\u003Cp>下一步最值得看的，不是它能不能出一张好图，而是它在同样提示词下能不能稳定给出同一类年龄感和面部特征。对生成式图像工具来说，这比单张样图漂亮更重要。\u003C\u002Fp>","Ideogram 4.0 在 ComfyUI 里首测，发丝、年龄控制和人物审美都暴露出明显差异。","zhuanlan.zhihu.com","https:\u002F\u002Fzhuanlan.zhihu.com\u002Fp\u002F2045866115067335894",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781118196304-kz61.png","model-release","en","be22e90e-25bf-46a2-b61a-0665559a69d8",[17,18,19,20,21],"Ideogram 4.0","ComfyUI","文生图","提示词工程","AI绘图",[23,24,25],"Ideogram 4.0 在人物年龄控制上偏差明显。","长提示词容易把模型带进固定审美模板。","ComfyUI 适合做这种模型首测和提示词对比。",0,"2026-06-10T19:02:33.786785+00:00","2026-06-10T19:02:33.78+00:00","1bae1133-d241-4581-9332-fbf39690c319",{"tags":31,"relatedLang":40,"relatedPosts":44},[32,33,35,36,38],{"name":20,"slug":20},{"name":21,"slug":34},"ai绘图",{"name":19,"slug":19},{"name":18,"slug":37},"comfyui",{"name":17,"slug":39},"ideogram-40",{"id":15,"slug":41,"title":42,"language":43},"ideogram-4-0-comfyui-first-test-zh","Ideogram 4.0 在 ComfyUI 首測的真實表現","zh",[45,51,57,63,69,75],{"id":46,"slug":47,"title":48,"cover_image":49,"image_url":49,"created_at":50,"category":13},"2c34e9fb-ebe7-46ca-996a-939d965159fd","xiaomi-mimo-1t-model-1000-tokens-per-second-en","Xiaomi MiMo pushes 1T model to 1000 tokens\u002Fs","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781129885712-1m6x.png","2026-06-10T22:17:35.756211+00:00",{"id":52,"slug":53,"title":54,"cover_image":55,"image_url":55,"created_at":56,"category":13},"95a7789d-26a5-4861-8e97-be3b4282618b","mimo-1000-tps-1t-model-ultraspeed-en","MiMo hits 1000 tokens\u002Fs on a 1T model","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781128995475-vjrm.png","2026-06-10T22:02:43.265168+00:00",{"id":58,"slug":59,"title":60,"cover_image":61,"image_url":61,"created_at":62,"category":13},"5087c618-81f0-44cf-b851-933b509f28ce","google-gemini-latest-update-maps-en","Google Gemini’s latest update centers on Maps","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781119072999-p0wf.png","2026-06-10T19:17:28.002681+00:00",{"id":64,"slug":65,"title":66,"cover_image":67,"image_url":67,"created_at":68,"category":13},"318ca45b-7063-4277-a810-80668c1907fe","chatgpt-adult-mode-paused-may-2026-en","ChatGPT Adult Mode Is Still Paused in May 2026","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781105578095-r0qo.png","2026-06-10T15:32:26.489231+00:00",{"id":70,"slug":71,"title":72,"cover_image":73,"image_url":73,"created_at":74,"category":13},"768b8352-3611-4527-99b1-dd1c87c45fea","claude-opus-4-8-api-pricing-benchmarks-openrouter-en","Claude Opus 4.8: $5\u002F$25 API pricing, 1M context","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781086675114-cu4j.png","2026-06-10T10:17:25.12768+00:00",{"id":76,"slug":77,"title":78,"cover_image":79,"image_url":79,"created_at":80,"category":13},"2eca32d0-5bb0-45b0-9cab-bec5eb6ab720","opus-48-best-benchmark-not-default-en","Opus 4.8 is the best model in the benchmark, not the default","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781085779007-t3ok.png","2026-06-10T10:02:22.755157+00:00",[82,87,92,97,102,107,112,117,122,127],{"id":83,"slug":84,"title":85,"created_at":86},"d4cffde7-9b50-4cc7-bb68-8bc9e3b15477","nvidia-rubin-ai-supercomputer-en","NVIDIA Unveils Rubin: A Leap in AI Supercomputing","2026-03-25T16:24:35.155565+00:00",{"id":88,"slug":89,"title":90,"created_at":91},"eab919b9-fbac-4048-89fc-afad6749ccef","google-gemini-ai-innovations-2026-en","Google's AI Leap with Gemini Innovations in 2026","2026-03-25T16:27:18.841838+00:00",{"id":93,"slug":94,"title":95,"created_at":96},"5f5cfc67-3384-4816-a8f6-19e44d90113d","gap-google-gemini-ai-checkout-en","Gap Teams Up with Google Gemini for AI-Driven Checkout","2026-03-25T16:27:46.483272+00:00",{"id":98,"slug":99,"title":100,"created_at":101},"f6d04567-47f6-49ec-804c-52e61ab91225","ai-model-release-wave-march-2026-en","Navigating the AI Model Release Wave of March 2026","2026-03-25T16:28:45.409716+00:00",{"id":103,"slug":104,"title":105,"created_at":106},"895c150c-569e-4fdf-939d-dade785c990e","small-language-models-transform-ai-en","Small Language Models: Llama 3.2 and Phi-3 Transform AI","2026-03-25T16:30:26.688313+00:00",{"id":108,"slug":109,"title":110,"created_at":111},"38eb1d26-d961-4fd3-ae12-9c4089680f5f","midjourney-v8-alpha-features-pricing-en","Midjourney V8 Alpha: A Deep Dive into Its Features and Pricing","2026-03-26T01:25:36.387587+00:00",{"id":113,"slug":114,"title":115,"created_at":116},"bf36bb9e-3444-4fb8-ab19-0df6bc9d8271","rag-2026-indispensable-ai-bridge-en","RAG in 2026: The Indispensable AI Bridge","2026-03-26T01:28:34.472046+00:00",{"id":118,"slug":119,"title":120,"created_at":121},"60881d6d-2310-44ef-b1fb-7f98e9dd2f0e","xiaomi-mimo-trio-agents-robots-voice-en","Xiaomi’s MiMo trio targets agents, robots, and voice","2026-03-28T03:05:08.899895+00:00",{"id":123,"slug":124,"title":125,"created_at":126},"f063d8d1-41d1-4de4-8ebc-6c40511b9369","xiaomi-mimo-v2-pro-1t-moe-agents-en","Xiaomi MiMo-V2-Pro: 1T MoE Model for Agents","2026-03-28T03:06:19.238032+00:00",{"id":128,"slug":129,"title":130,"created_at":131},"a1379e9a-6785-4ff5-9b0a-8cff55f8264f","cursor-composer-2-started-from-kimi-en","Cursor’s Composer 2 started from Kimi","2026-03-28T03:11:59.132398+00:00"]