[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-qwen36-27b-open-source-coding-model-zh":3,"article-related-qwen36-27b-open-source-coding-model-zh":29,"series-model-release-14d41e89-8fff-4e3a-b021-2a64f29279ca":77},{"id":4,"slug":5,"title":6,"content":7,"summary":8,"source":9,"source_url":10,"author":11,"image_url":12,"cover_image":13,"category":14,"language":15,"translated_content":11,"related_article_id":16,"keywords":17,"key_takeaways":11,"views":26,"created_at":27,"published_at":28,"topic_cluster_id":11},"14d41e89-8fff-4e3a-b021-2a64f29279ca","qwen36-27b-open-source-coding-model-zh","Qwen3.6-27B：更小卻更準的寫碼路線","\u003Cp>阿里巴巴的 \u003Ca href=\"https:\u002F\u002Fqwen.ai\u002F\" target=\"_blank\" rel=\"noopener\">Qwen\u003C\u002Fa> 團隊又丟出一顆重磅模型，名字叫 \u003Ca href=\"https:\u002F\u002Fhuggingface.co\u002FQwen\" target=\"_blank\" rel=\"noopener\">Qwen3.6-27B\u003C\u002Fa>。它是 270 億參數的 dense multimodal 模型，不是那種動不動就上百 B 的怪獸。\u003C\u002Fp>\u003Cp>但數字很有意思。它在 \u003Ca href=\"https:\u002F\u002Fwww.swebench.com\u002F\" target=\"_blank\" rel=\"noopener\">SWE-bench Verified\u003C\u002Fa> 拿到 77.2。這個分數還壓過更大的 Qwen3.5-397B-A17B。講白了，就是更小，卻更會寫碼。\u003C\u002Fp>\u003Cp>對開發者來說，這種結果很實際。你不只看模型有多大。你還要看它好不好部署，延遲高不高，伺服器扛不扛得住。Qwen3.6-27B 直接把這題拉到桌面上。\u003C\u002Fp>\u003Ch2>為什麼這次發表很有看頭\u003C\u002Fh2>\u003Cp>這次的重點，不是 Qwen 又發了新模型。重點是，27B dense 模型居然能打贏 397B MoE 模型。這差距不是小修小補。這是架構選擇開始影響實戰結果。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1777260630350-1mxe.png\" alt=\"Qwen3.6-27B：更小卻更準的寫碼路線\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>Qwen3.6-27B 主打 agentic coding。也就是說，它不是只會補幾行程式碼。它要能處理終端機、修 bug、看文件，還要能在多輪互動裡持續做事。這種任務很吃模型穩定性。\u003C\u002Fp>\u003Cp>它還支援 thinking 與 non-thinking 兩種模式。再加上圖片、影片、文字輸入，這就不是單純的 code model 了。它比較像一個可以看畫面、讀 log、理解文件的工作型 LLM。\u003C\u002Fp>\u003Cul>\u003Cli>模型規模：27B，dense 架構\u003C\u002Fli>\u003Cli>對手：Qwen3.5-397B-A17B，397B MoE，17B active parameters\u003C\u002Fli>\u003Cli>可用管道：\u003Ca href=\"https:\u002F\u002Fchat.qwen.ai\u002F\" target=\"_blank\" rel=\"noopener\">Qwen Studio\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fhuggingface.co\u002FQwen\" target=\"_blank\" rel=\"noopener\">Hugging Face\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fwww.modelscope.cn\u002Forganization\u002FQwen\" target=\"_blank\" rel=\"noopener\">ModelScope\u003C\u002Fa>\u003C\u002Fli>\u003Cli>雲端 API：\u003Ca href=\"https:\u002F\u002Fwww.alibabacloud.com\u002Fproduct\u002Fbailian\" target=\"_blank\" rel=\"noopener\">Alibaba Cloud Bailian\u003C\u002Fa>\u003C\u002Fli>\u003C\u002Ful>\u003Cp>我覺得這裡最重要的，不是「它更小」。而是它更容易進 production。dense 模型不用像 MoE 那樣做 expert routing。少一層複雜度，通常就少一堆部署麻煩。\u003C\u002Fp>\u003Cp>對台灣很多團隊來說，這很有感。你可能沒有超大 GPU 叢集。你可能只有幾台伺服器。這時候，模型能不能穩定跑，比 paper 上的參數數字更重要。\u003C\u002Fp>\u003Ch2>Benchmark 數字才是主菜\u003C\u002Fh2>\u003Cp>很多模型發表都愛講故事，但這次的分數真的有料。Qwen3.6-27B 在 SWE-bench Verified 拿 77.2，在 SWE-bench Pro 拿 53.5，在 Terminal-Bench 2.0 拿 59.3，在 SkillsBench 拿 48.2。\u003C\u002Fp>\u003Cp>對比 Qwen3.5-397B-A17B，分數分別是 76.2、50.9、52.5、30.0。你會發現，Qwen3.6-27B 幾乎在每個項目都更好。尤其 SkillsBench，差了快 18 分，這不是小事。\u003C\u002Fp>\u003Cp>這代表\u003Ca href=\"\u002Fnews\u002Fai-zh\">什麼\u003C\u002Fa>？代表它不只是會背程式碼。它在 agent 工作流裡，可能更會做決策、更會接續上下文，也更懂得怎麼把任務做完。這種差異，對 coding assist\u003Ca href=\"\u002Fnews\u002Fcognizant-codex-zh\">ant\u003C\u002Fa> 很要命。\u003C\u002Fp>\u003Cblockquote>“The future of AI is not about bigger models. It’s about better models.” — Sam Altman, OpenAI DevDay 2023\u003C\u002Fblockquote>\u003Cp>這句話拿來看 Qwen3.6-27B 很貼切。因為這次大家討論的重點，已經不是參數數字有多大。重點變成，這模型到底能幫開發者省多少工。\u003C\u002Fp>\u003Cp>另外，Qwen 還提到 GPQA Diamond 87.8。這不是 coding benchmark，但它可以補一個訊號。模型的推理能力沒有只卡在程式題目上。\u003C\u002Fp>\u003Cul>\u003Cli>SWE-bench Verified：77.2 vs 76.2\u003C\u002Fli>\u003Cli>SWE-bench Pro：53.5 vs 50.9\u003C\u002Fli>\u003Cli>Terminal-Bench 2.0：59.3 vs 52.5\u003C\u002Fli>\u003Cli>SkillsBench：48.2 vs 30.0\u003C\u002Fli>\u003Cli>GPQA Diamond：87.8\u003C\u002Fli>\u003C\u002Ful>\u003Cp>如果你只看一個數字，我會選 SkillsBench。因為 agentic coding 最怕的是模型只會答題，不會做事。這個分數差距，剛好點出它在實際工作流裡的優勢。\u003C\u002Fp>\u003Cp>而且它贏的是更大的 MoE 模型。這種結果會讓很多人重新想一遍：到底是堆參數比較重要，還是把架構和訓練方向調準比較重要？\u003C\u002Fp>\u003Ch2>開發者今天就能怎麼用\u003C\u002Fh2>\u003Cp>Qwen3.6-27B 已經能在 \u003Ca href=\"https:\u002F\u002Fchat.qwen.ai\u002F\" target=\"_blank\" rel=\"noopener\">Qwen Studio\u003C\u002Fa> 試用。權重也放在 \u003Ca href=\"https:\u002F\u002Fhuggingface.co\u002FQwen\" target=\"_blank\" rel=\"noopener\">Hugging Face\u003C\u002Fa> 和 \u003Ca href=\"https:\u002F\u002Fwww.modelscope.cn\u002Forganization\u002FQwen\" target=\"_blank\" rel=\"noopener\">ModelScope\u003C\u002Fa>。這代表你可以先線上試，再決定要不要拉進內部環境。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1777260624552-xc58.png\" alt=\"Qwen3.6-27B：更小卻更準的寫碼路線\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>對團隊來說，這很方便。你不用等封閉測試。你可以直接拿它做 code review、文件理解、或內部 agent 測試。這種開放程度，對開發流程很友善。\u003C\u002Fp>\u003Cp>它也能接到一些現成工具，像 \u003Ca href=\"https:\u002F\u002Fgithub.com\u002FOpenClawAI\u002FOpenClaw\" target=\"_blank\" rel=\"noopener\">OpenClaw\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fanthropics\u002Fclaude-code\" target=\"_blank\" rel=\"noopener\">Claude Code\u003C\u002Fa>，還有 \u003Ca href=\"https:\u002F\u002Fgithub.com\u002FQwenLM\u002Fqwen-code\" target=\"_blank\" rel=\"noopener\">Qwen Code\u003C\u002Fa>。這點很關鍵。因為它不是要你整套重做，而是想塞進你本來就在用的工作流。\u003C\u002Fp>\u003Cp>它還支援圖片和影片。這就很適合 UI debug、看截圖找 bug、或讀設計稿。你可能會想問，這跟一般 code model 差在哪？差在它能處理更多真實世界的髒資料。\u003C\u002Fp>\u003Cp>Qwen 也提到未來 API 會支援 preserve_thinking。對 agent 來說，這種功能很實用。它可以讓模型保留前面的推理脈絡，少一點重複說明。\u003C\u002Fp>\u003Cp>如果這功能真的穩，長對話的 coding session 會順很多。你不用一直重講需求。模型也比較不會在中途斷線式失憶。\u003C\u002Fp>\u003Ch2>跟其他開源模型比，差在哪\u003C\u002Fh2>\u003Cp>把 Qwen3.6-27B 放到開源模型市場看，位置其實很清楚。它不是最大，也不是最吵。但它很像那種「實戰派」模型。dense、multimodal、又偏 agentic coding。\u003C\u002Fp>\u003Cp>這跟一些大型 MoE 模型的路線不同。MoE 很強，但部署常常比較麻煩。你要處理 routing，要處理資源分配，還要考慮 latency 抖動。對很多產品團隊來說，這些都不是小事。\u003C\u002Fp>\u003Cp>下面這個比較，會比較有感：\u003C\u002Fp>\u003Cul>\u003Cli>\u003Ca href=\"https:\u002F\u002Fai.meta.com\u002Fllama\u002F\" target=\"_blank\" rel=\"noopener\">Meta Llama\u003C\u002Fa>：生態系很大，但在 coding agent 的專注度上，Qwen 這次更兇。\u003C\u002Fli>\u003Cli>\u003Ca href=\"https:\u002F\u002Fwww.deepseek.com\u002F\" target=\"_blank\" rel=\"noopener\">DeepSeek\u003C\u002Fa>：在 coding 和 reasoning 很有存在感，但 Qwen3.6-27B 的 dense 架構更好部署。\u003C\u002Fli>\u003Cli>\u003Ca href=\"https:\u002F\u002Fqwen.ai\u002F\" target=\"_blank\" rel=\"noopener\">Qwen3.5-397B-A17B\u003C\u002Fa>：參數更大，卻在這批 benchmark 上輸給 27B 版本。\u003C\u002Fli>\u003Cli>\u003Ca href=\"https:\u002F\u002Fgithub.com\u002FQwenLM\u002FQwen3\" target=\"_blank\" rel=\"noopener\">Qwen 開源系列\u003C\u002Fa>：持續往可落地的 agent 工作流靠近。\u003C\u002Fli>\u003C\u002Ful>\u003Cp>說白了，這次不是在比誰比較會喊口號。是在比誰比較能進機房。27B dense 模型通常更容易塞進實際預算，也更容易做 latency 優化。\u003C\u002Fp>\u003Cp>如果你在做 AI coding 產品，這種差異很現實。你不是只要分數漂亮。你還要 API 穩、成本可控、回應速度別太慢。\u003C\u002Fp>\u003Ch2>這波對開源 AI coding 的意義\u003C\u002Fh2>\u003Cp>Qwen3.6-27B 其實在提醒大家一件事。現在的模型競爭，不再只是比誰聊天比較像人。更重要的是，誰能在 terminal、repo、log、文件、截圖裡一起工作。\u003C\u002Fp>\u003Cp>這也是為什麼 agentic coding 會變成主戰場。因為開發工作本來就不是單輪問答。它是修 bug、改檔案、重跑測試、再回頭修正。模型如果只會一次性回答，就很難真的上線。\u003C\u002Fp>\u003Cp>我覺得接下來開源模型的分水嶺，會是「能不能穩定做事」。不是「能不能講得漂亮」。Qwen3.6-27B 這次的 benchmark，剛好把這件事講得很直白。\u003C\u002Fp>\u003Cp>如果它在社群測試裡也維持這個表現，那它很可能會變成很多團隊的預設選項。尤其是那些想做內部 coding assistant，卻又不想背太高推理成本的團隊。\u003C\u002Fp>\u003Cp>對台灣開發團隊來說，這個方向很實際。你可以先拿它做小規模 A\u002FB test。看它在你的 repo、你的語言、你的 CI 流程裡，到底能不能省時間。\u003C\u002Fp>\u003Ch2>接下來該怎麼看\u003C\u002Fh2>\u003Cp>我會建議先看兩件事。第一，社群實測會不會跟 benchmark 一樣漂亮。第二，它在真實專案裡的 token 成本和延遲表現怎樣。這兩個數字，會決定它能不能進 production。\u003C\u002Fp>\u003Cp>如果你現在就在選 coding model，Qwen3.6-27B 值得先跑一輪。不是因為它名字新，而是因為它把「小模型也能做重活」這件事，做得很像樣。你可以先從一個內部 repo 開始測。\u003C\u002Fp>\u003Cp>我自己的判斷很直接：接下來 6 到 12 個月，真正吃香的 o\u003Ca href=\"\u002Fnews\u002Fwhy-openai-must-stop-treating-violent-threats-as-a-threshold-zh\">pen\u003C\u002Fa> model，不會只是參數最大的那個。會是部署成本、推理品質、agent 穩定度都平衡得好的那個。Qwen3.6-27B 已經把這條路畫得很清楚。\u003C\u002Fp>","Qwen3.6-27B 是 27B dense multimodal 模型，在 SWE-bench Verified 拿到 77.2，還贏過更大的 Qwen3.5-397B-A17B。對開發團隊來說，這代表更好部署，也更適合 agentic coding。","zhuanlan.zhihu.com","https:\u002F\u002Fzhuanlan.zhihu.com\u002Fp\u002F2030389090131165374",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1777260630350-1mxe.png","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Fskill-cover-qwen36-27b-zh_-1777263004.png","model-release","zh","674cce69-5be8-4c32-bfbd-32ab6fd2fcd7",[18,19,20,21,22,23,24,25],"Qwen3.6-27B","開源模型","AI寫程式","agentic coding","SWE-bench Verified","dense model","multimodal LLM","Hugging Face",17,"2026-04-27T00:12:38.326898+00:00","2026-04-27T00:12:38.182+00:00",{"tags":30,"relatedLang":36,"relatedPosts":40},[31,32,34],{"name":19,"slug":19},{"name":21,"slug":33},"agentic-coding",{"name":22,"slug":35},"swe-bench-verified",{"id":16,"slug":37,"title":38,"language":39},"qwen36-27b-open-source-coding-model-en","Qwen3.6-27B opens a smaller, sharper path to coding","en",[41,47,53,59,65,71],{"id":42,"slug":43,"title":44,"cover_image":45,"image_url":45,"created_at":46,"category":14},"cfb68e08-fe4e-49f6-b449-e566faf56311","kimi-2-7-price-coding-benchmark-zh","Kimi 2.7 讓價格成為真正的寫碼基準","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782746270225-tcs9.png","2026-06-29T15:17:24.321277+00:00",{"id":48,"slug":49,"title":50,"cover_image":51,"image_url":51,"created_at":52,"category":14},"ca1e6960-10e7-4fa7-949f-c5991c99fc7e","kimi-k26-open-source-coding-agentic-ai-benchmarks-zh","Kimi K2.6 登頂程式與代理式 AI 基準","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782739078329-qvne.png","2026-06-29T13:17:26.530857+00:00",{"id":54,"slug":55,"title":56,"cover_image":57,"image_url":57,"created_at":58,"category":14},"edf8e66b-c717-4cc1-b15a-96839bb7bbcf","llama-legends-380-season-3-heroes-raids-zh","Llama Legends 3.8.0 推出 Season 3 英雄與突襲","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782711179415-qurv.png","2026-06-29T05:32:32.733919+00:00",{"id":60,"slug":61,"title":62,"cover_image":63,"image_url":63,"created_at":64,"category":14},"88d353ca-468b-4774-922d-ef0cbc2edd68","omlx-045-dev1-glm52-minimax-m3-speedups-zh","oMLX 0.4.5.dev1 讓長上下文更快","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782709372375-25nm.png","2026-06-29T05:02:28.341041+00:00",{"id":66,"slug":67,"title":68,"cover_image":69,"image_url":69,"created_at":70,"category":14},"e6ae84b6-4e55-4ab2-a1cf-4a08e23cbc77","grok-45-private-beta-tesla-spacex-zh","Grok 4.5 先進 Tesla 和 SpaceX 內測","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782687769532-te5b.png","2026-06-28T23:02:22.915901+00:00",{"id":72,"slug":73,"title":74,"cover_image":75,"image_url":75,"created_at":76,"category":14},"186b266a-5b45-4bd4-85a4-5fa62fcc50dc","google-openrl-llm-fine-tuning-kubernetes-zh","Google OpenRL 把 RL 細調搬上 Kubernetes","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1782572576166-gzxw.png","2026-06-27T15:02:27.036919+00:00",[78,83,88,93,98,103,108,113,118,123],{"id":79,"slug":80,"title":81,"created_at":82},"58b64033-7eb6-49b9-9aab-01cf8ae1b2f2","nvidia-rubin-six-chips-one-ai-supercomputer-zh","NVIDIA Rubin 把六顆晶片塞進 AI 機櫃","2026-03-26T07:18:45.861277+00:00",{"id":84,"slug":85,"title":86,"created_at":87},"0dcc2c61-c2a6-480d-adb8-dd225fc68914","march-2026-ai-model-news-what-mattered-zh","2026 年 3 月 AI 模型新聞重點","2026-03-26T07:32:08.386348+00:00",{"id":89,"slug":90,"title":91,"created_at":92},"214ab08b-5ce5-4b5c-8b72-47619d8675dd","why-small-models-are-winning-on-device-ai-zh","小模型為何吃下裝置端 AI","2026-03-26T07:36:30.488966+00:00",{"id":94,"slug":95,"title":96,"created_at":97},"785624b2-0355-4b82-adc3-de5e45eecd88","midjourney-v8-faster-images-higher-costs-zh","Midjourney V8 變快了，也變貴了","2026-03-26T07:52:03.562971+00:00",{"id":99,"slug":100,"title":101,"created_at":102},"cda76b92-d209-4134-86c1-a60f5bc7b128","xiaomi-mimo-trio-agents-robots-voice-zh","小米 MiMo 三模型瞄準代理、機器人與語音","2026-03-28T03:05:08.779489+00:00",{"id":104,"slug":105,"title":106,"created_at":107},"9e1044b4-946d-47fe-9e2a-c2ee032e1164","xiaomi-mimo-v2-pro-1t-moe-agents-zh","小米 MiMo-V2-Pro 登場：1T MoE 模型","2026-03-28T03:06:19.002353+00:00",{"id":109,"slug":110,"title":111,"created_at":112},"c4b6186f-bd84-4598-997e-c6e31d543c0d","cursor-composer-2-agentic-coding-model-zh","Cursor Composer 2 走向代理式寫碼","2026-03-28T03:13:06.422716+00:00",{"id":114,"slug":115,"title":116,"created_at":117},"e112e76f-ec3b-408f-810e-e93ae21a888a","apple-siri-gemini-distilled-models-zh","Apple Siri 牽手 Gemini 的真相","2026-03-29T04:52:57.886544+00:00",{"id":119,"slug":120,"title":121,"created_at":122},"c679b51f-194a-463b-87fc-7695256ff752","mimo-v2-pro-vs-omni-vs-flash-2026-zh","MiMo V2 Pro、Omni、Flash 怎麼選","2026-04-02T01:18:43.576128+00:00",{"id":124,"slug":125,"title":126,"created_at":127},"3b988fd7-6749-4f01-ba25-c0ad7486dc31","z-ai-glm-5v-turbo-design2code-claude-zh","GLM-5V-Turbo 在 Design2Code 贏了…","2026-04-02T04:03:36.31741+00:00"]