[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-microsoft-launches-three-in-house-ai-models-zh":3,"article-related-microsoft-launches-three-in-house-ai-models-zh":28,"series-model-release-33ef53ea-c20f-49ed-85ad-96e19be90ab6":87},{"id":4,"slug":5,"title":6,"content":7,"summary":8,"source":9,"source_url":10,"author":11,"image_url":12,"cover_image":12,"category":13,"language":14,"translated_content":11,"related_article_id":15,"keywords":16,"key_takeaways":11,"views":25,"created_at":26,"published_at":27,"topic_cluster_id":11},"33ef53ea-c20f-49ed-85ad-96e19be90ab6","microsoft-launches-three-in-house-ai-models-zh","Microsoft 推出三款自家 AI 模型","\u003Cp>Microsoft 這次不是小修小補。它直接端出三款自家 AI 模型，分別做文字、語音、圖片。時間點也很硬：2026 年 4 月 2 日。\u003Ca href=\"https:\u002F\u002Fwww.microsoft.com\u002F\" target=\"_blank\" rel=\"noopener\">Microsoft\u003C\u002Fa> 這回明講了，自己要在模型層多踩一腳。\u003C\u002Fp>\u003Cp>最吸睛的是 \u003Cstrong>MAI-Transcribe-1\u003C\u002Fstrong>。它支援 25 種語言，還號稱比 Azure Fast 快 2.5 倍。\u003Cstrong>MAI-Voice-1\u003C\u002Fstrong> 更誇張，1 秒能生出 60 秒音訊。這種數字很像在對市場喊話：我不只會做，我還要做得便宜。\u003C\u002Fp>\u003Ch2>Microsoft 這次到底丟了什麼\u003C\u002Fh2>\u003Cp>這三款模型來自 \u003Ca href=\"https:\u002F\u002Fwww.microsoft.com\u002Fen-us\u002Fai\" target=\"_blank\" rel=\"noopener\">Microsoft AI\u003C\u002Fa>。團隊由 Mustafa Suleyman 領軍。名字分別是 \u003Cstrong>MAI-Transcribe-1\u003C\u002Fstrong>、\u003Cstrong>MAI-Voice-1\u003C\u002Fstrong>、\u003Cstrong>MAI-Image-2\u003C\u002Fstrong>。它們會先進到 \u003Ca href=\"https:\u002F\u002Fazure.microsoft.com\u002Fproducts\u002Fai-foundry\" target=\"_blank\" rel=\"noopener\">Microsoft Foundry\u003C\u002Fa> 和 \u003Ca href=\"https:\u002F\u002Fwww.microsoft.com\u002Fen-us\u002Fai\u002Fai-playground\" target=\"_blank\" rel=\"noopener\">MAI Playground\u003C\u002Fa>，讓開發者先試，再決定要不要上線。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1775172105180-ufot.png\" alt=\"Microsoft 推出三款自家 AI 模型\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>講白了，\u003Ca href=\"\u002Fnews\u002Fmicrosoft-adds-multi-model-copilot-workflows-zh\">Micr\u003C\u002Fa>osoft 不是只想賣雲端。它想把模型層也握在手上。這很符合它一貫套路：先把入口做大，再把工具鏈黏住你。對企業客戶來說，這種做法很實際，因為採購、測試、部署可以放在同一套流程裡。\u003C\u002Fp>\u003Cp>而且這次不是單打獨鬥。\u003Ca href=\"\u002Fnews\u002Fmidjourney-public-beta-visual-generation-history-zh\">Mi\u003C\u002Fa>crosoft 一邊跟 \u003Ca href=\"https:\u002F\u002Fopenai.com\u002F\" target=\"_blank\" rel=\"noopener\">OpenAI\u003C\u002Fa> 綁很深，一邊又自己養模型。這種雙線打法，說穿了就是保留退路。AI 市場變化太快，誰都不想把命運全押在別人身上。\u003C\u002Fp>\u003Cul>\u003Cli>MAI-Transcribe-1 支援 25 種語言\u003C\u002Fli>\u003Cli>Microsoft 說它比 Azure Fast 快 2.5 倍\u003C\u002Fli>\u003Cli>MAI-Voice-1 可在 1 秒內生出 60 秒音訊\u003C\u002Fli>\u003Cli>MAI-Transcribe-1 起價是每小時 0.36 美元\u003C\u002Fli>\u003Cli>MAI-Voice-1 起價是每 100 萬字元 22 美元\u003C\u002Fli>\u003Cli>MAI-Image-2 起價是每 100 萬文字輸入 token 5 美元\u003C\u002Fli>\u003C\u002Ful>\u003Cp>這些價格很有意思。它們不是在拚一個超大通用模型。它們是在拚任務單價。對企業來說，這才是重點。你做客服轉寫、語音助理、內容生成，成本只要少一點，財務部就會比較好看。\u003C\u002Fp>\u003Ch2>Suleyman 想把 AI 說成更像工具\u003C\u002Fh2>\u003Cp>這批模型由 \u003Ca href=\"https:\u002F\u002Fwww.microsoft.com\u002Fen-us\u002Fai\u002Fai-superintelligence\" target=\"_blank\" rel=\"noopener\">MAI Superintelligence team\u003C\u002Fa> 做出來。這個團隊在 2025 年 11 月成立。Suleyman 在官方文章裡提到一個詞：Human\u003Ca href=\"\u002Fnews\u002Fmistral-voxtral-tts-open-source-voice-ai-zh\">ist\u003C\u002Fa> AI。聽起來很文青，但意思其實很直白，就是把人放在中心，模型要更貼近真實溝通。\u003C\u002Fp>\u003Cp>他原話是這樣說的：\u003C\u002Fp>\u003Cblockquote>“At Microsoft AI, we’re building Humanist AI. We have a distinct view when creating our AI models — putting humans at the center, optimizing for how people actually communicate, training for practical use.”\u003C\u002Fblockquote>\u003Cp>這段話不是只有公關味。它也在講產品方向。Microsoft 想把模型做成能直接進工作流程的工具。不是只拿來跑 benchmark，也不是只在 demo 場合帥一下。對台灣開發者來說，這種定位很熟悉，就是先求穩，再求快。\u003C\u002Fp>\u003Cp>Suleyman 也一直在處理和 OpenAI 的關係。他在接受 \u003Ca href=\"https:\u002F\u002Fventurebeat.com\u002F\" target=\"_blank\" rel=\"noopener\">VentureBeat\u003C\u002Fa> 訪問時，還是強調合作關係沒斷。\u003Ca href=\"https:\u002F\u002Fwww.theverge.com\u002F\" target=\"_blank\" rel=\"noopener\">The Verge\u003C\u002Fa> 也提到，新的協議讓 Microsoft 在自家超級智慧研究上有更多空間。這代表什麼？代表它不想只當大金主，它想當自己模型路線的主控方。\u003C\u002Fp>\u003Ch2>數字很直接，目標也很直接\u003C\u002Fh2>\u003Cp>AI 市場現在很擠。\u003Ca href=\"https:\u002F\u002Fcloud.google.com\u002Fvertex-ai\u002Fgenerative-ai\" target=\"_blank\" rel=\"noopener\">Google Vertex AI\u003C\u002Fa>、OpenAI、Anthropic，還有一堆新創，都在搶同一批預算。這時候比誰更會講故事，意義沒那麼大。真正有用的是：誰的 API 夠快、夠便宜、夠穩。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1775172109746-slxg.png\" alt=\"Microsoft 推出三款自家 AI 模型\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>Microsoft 這次給的數字，幾乎就是在打這個點。MAI-Transcribe-1 每小時 0.36 美元。MAI-Voice-1 每 100 萬字元 22 美元。MAI-Image-2 則是每 100 萬文字輸入 token 5 美元、每 100 萬圖片輸出 token 33 美元。這些都很像在說：我不是來秀肌肉，我是來搶工作量。\u003C\u002Fp>\u003Cp>如果你是開發者，你會很快想到幾個場景。客服錄音轉文字、會議逐字稿、語音導覽、App 內配音、商品圖生成。這些都不是玩具需求。它們是會燒錢的真實需求。只要單次成本降一點，整個產品的毛利就會比較像樣。\u003C\u002Fp>\u003Cp>更重要的是，Microsoft 把這些模型放進 Foundry。這表示企業不用重做整套 AI 管線。你原本就在 Azure 上跑服務，現在多半只要換模型端點。這種低摩擦切換，對採購部門來說很有吸引力。\u003C\u002Fp>\u003Cul>\u003Cli>MAI-Transcribe-1：25 語言，2.5 倍速度優勢\u003C\u002Fli>\u003Cli>MAI-Voice-1：1 秒生成 60 秒音訊\u003C\u002Fli>\u003Cli>MAI-Image-2：同時涵蓋文字輸入與圖片輸出計價\u003C\u002Fli>\u003Cli>OpenAI：強在通用能力與生態聲量\u003C\u002Fli>\u003Cli>Google：強在雲端整合與多模態產品線\u003C\u002Fli>\u003Cli>Microsoft：強在企業合約與 Azure 既有客戶\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>這跟競品比，差在哪\u003C\u002Fh2>\u003Cp>如果只看模型能力，大家都會說自己很強。這種話聽多了，真的會膩。比較有意思的是產品路線。OpenAI 比較像把旗艦模型先推到前面，再慢慢往企業產品補齊。Google 則是把模型塞進雲端和搜尋生態。Microsoft 這次的打法很明確：直接把模型變成企業可採購的零件。\u003C\u002Fp>\u003Cp>這種打法的優點很現實。第一，採購流程短。第二，帳單容易算。第三，開發者不必換整套平台。對很多台灣公司來說，這比模型排行榜上的 0.5 分差距更重要。因為真的上線後，大家只看成本和 SLA。\u003C\u002Fp>\u003Cp>如果拿語音轉寫來看，MAI-Transcribe-1 的賣點很清楚。25 種語言夠用，2.5 倍速度也夠有感。對客服中心、媒體、教育平台來說，這種速度差異會直接反映在等待時間和伺服器成本上。這不是抽象優勢，是帳單上的差別。\u003C\u002Fp>\u003Cp>再看語音生成。\u003Ca href=\"https:\u002F\u002Fwww.microsoft.com\u002Fen-us\u002Fai\" target=\"_blank\" rel=\"noopener\">Microsoft AI\u003C\u002Fa> 說 MAI-Voice-1 可以 1 秒產生 60 秒音訊。這個速度很猛，但實務上還要看音質、情緒控制、停頓自然度。因為企業不是只要快，還要能用。這就是和 \u003Ca href=\"https:\u002F\u002Fopenai.com\u002F\" target=\"_blank\" rel=\"noopener\">OpenAI\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fcloud.google.com\u002Fvertex-ai\u002Fgenerative-ai\" target=\"_blank\" rel=\"noopener\">Google\u003C\u002Fa> 拉開差距的地方。\u003C\u002Fp>\u003Ch2>背後其實是平台戰\u003C\u002Fh2>\u003Cp>Microsoft 這步棋，表面上是推出三個模型。實際上是把平台戰再往前推一格。它想讓開發者在 Azure 裡就能完成測試、部署、計費。這種整合式路線，對大型企業很有用，因為 IT 團隊最怕東拼西湊。\u003C\u002Fp>\u003Cp>另一個背景是成本壓力。現在很多公司都在算 AI ROI。模型再強，若每次呼叫都貴到爆，最後還是只能放在 demo。Microsoft 這次把價格壓到一個明顯能談商務的區間，就是要讓 AI 變成可大量使用的基礎設施，而不是只給產品經理拍片用。\u003C\u002Fp>\u003Cp>我覺得這也反映一件事。AI 競爭早就不是單純比誰模型大。現在比的是誰能把模型塞進既有雲端、資料、權限、付款和監控系統。誰能少讓工程師重寫一段 code，誰就比較容易拿到合約。\u003C\u002Fp>\u003Cp>對台灣開發團隊來說，這類消息的重點很簡單。不要只盯著模型名稱。要看價格表、延遲、區域支援、語言品質、以及能不能直接接你現在的 API 架構。說真的，這些才是會決定你要不要切換的東西。\u003C\u002Fp>\u003Ch2>接下來要看什麼\u003C\u002Fh2>\u003Cp>我會先看兩件事。第一，這三款模型會不會很快進到更多 Microsoft 產品。第二，實際第三方測試會不會跟官方數字差很多。AI 圈很常見這種狀況：簡報很漂亮，上線後才知道真相。\u003C\u002Fp>\u003Cp>如果 MAI-Transcribe-1 和 MAI-Voice-1 的表現真的穩，最先受惠的會是客服、媒體、教育和企業內部工具。這些場景對速度和成本都很敏感。反過來說，如果品質不夠穩，市場也不會客氣，因為企業客戶最會算帳。\u003C\u002Fp>\u003Cp>我的預測很直接。Microsoft 接下來會把更多自家模型塞進 Foundry，然後用價格和整合度去搶企業單。你如果是開發者，現在就該試試看這些 API。不要等別人先把流程接完，才回頭補功課。\u003Ca href=\"https:\u002F\u002Fazure.microsoft.com\u002Fproducts\u002Fai-foundry\" target=\"_blank\" rel=\"noopener\">Microsoft Foundry\u003C\u002Fa> 和 \u003Ca href=\"https:\u002F\u002Fwww.microsoft.com\u002Fen-us\u002Fai\u002Fai-playground\" target=\"_blank\" rel=\"noopener\">MAI Playground\u003C\u002Fa> 已經開著了，直接玩最準。\u003C\u002Fp>","Microsoft 一口氣推出文字、語音、圖片三款自家 AI 模型。MAI-Transcribe-1 主打 25 種語言、速度比 Azure Fast 快 2.5 倍，價格也更低，直接把企業採購壓力丟回市場。","techcrunch.com","https:\u002F\u002Ftechcrunch.com\u002F2026\u002F04\u002F02\u002Fmicrosoft-takes-on-ai-rivals-with-three-new-foundational-models\u002F",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1775172105180-ufot.png","model-release","zh","78908214-aba5-4673-b3ae-cf432c1826c9",[17,18,19,20,21,22,23,24],"Microsoft","AI模型","MAI-Transcribe-1","MAI-Voice-1","MAI-Image-2","Azure","Foundry","OpenAI",9,"2026-04-02T23:21:30.619885+00:00","2026-04-02T23:21:30.534+00:00",{"tags":29,"relatedLang":46,"relatedPosts":50},[30,32,34,36,38,40,42,44],{"name":19,"slug":31},"mai-transcribe-1",{"name":17,"slug":33},"microsoft",{"name":24,"slug":35},"openai",{"name":21,"slug":37},"mai-image-2",{"name":18,"slug":39},"ai模型",{"name":22,"slug":41},"azure",{"name":20,"slug":43},"mai-voice-1",{"name":23,"slug":45},"foundry",{"id":15,"slug":47,"title":48,"language":49},"microsoft-launches-three-in-house-ai-models-en","Microsoft launches three in-house AI models","en",[51,57,63,69,75,81],{"id":52,"slug":53,"title":54,"cover_image":55,"image_url":55,"created_at":56,"category":13},"8810b91a-9aa2-4cd6-a58b-18fad5897423","devin-booker-sedona-mcdonalds-shoe-launch-zh","Booker把Sedona麥當勞變鞋款發表場","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780510686292-fm1k.png","2026-06-03T18:17:31.966783+00:00",{"id":58,"slug":59,"title":60,"cover_image":61,"image_url":61,"created_at":62,"category":13},"d4d7e664-cc7f-4211-a733-b7c111b86bd6","best-open-source-llms-2026-ranked-zh","2026 最佳開源 LLM 排名","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780396385004-yyka.png","2026-06-02T10:32:37.264398+00:00",{"id":64,"slug":65,"title":66,"cover_image":67,"image_url":67,"created_at":68,"category":13},"06774dfe-08eb-4a53-a8f7-36389b462c2b","llama-3-1-70b-specs-benchmarks-deployment-zh","Llama 3.1 70B：規格與部署","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780395481064-5yri.png","2026-06-02T10:17:33.072306+00:00",{"id":70,"slug":71,"title":72,"cover_image":73,"image_url":73,"created_at":74,"category":13},"e8ee6f00-cf62-41e6-83b7-92ce148fe46e","kill-bill-whole-bloody-affair-4k-blu-ray-zh","《追殺比爾：血腥全集》4K 藍光上市","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780364908972-15qn.png","2026-06-02T01:48:00.707278+00:00",{"id":76,"slug":77,"title":78,"cover_image":79,"image_url":79,"created_at":80,"category":13},"893178f1-7aba-4a0c-a3cf-1812c9d3283e","almalinux-10-2-9-8-new-stacks-zh","AlmaLinux 10.2 與 9.8 更新了什麼","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780291073047-7bxy.png","2026-06-01T05:17:27.940241+00:00",{"id":82,"slug":83,"title":84,"cover_image":85,"image_url":85,"created_at":86,"category":13},"9b6f1df5-7240-4afd-bba5-5b58d3b67875","claude-opus-48-vs-47-agentic-upgrades-zh","Claude Opus 4.8 跟 4.7 差在哪","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780225374997-pk0c.png","2026-05-31T11:02:28.501538+00:00",[88,93,98,103,108,113,118,123,128,133],{"id":89,"slug":90,"title":91,"created_at":92},"58b64033-7eb6-49b9-9aab-01cf8ae1b2f2","nvidia-rubin-six-chips-one-ai-supercomputer-zh","NVIDIA Rubin 把六顆晶片塞進 AI 機櫃","2026-03-26T07:18:45.861277+00:00",{"id":94,"slug":95,"title":96,"created_at":97},"0dcc2c61-c2a6-480d-adb8-dd225fc68914","march-2026-ai-model-news-what-mattered-zh","2026 年 3 月 AI 模型新聞重點","2026-03-26T07:32:08.386348+00:00",{"id":99,"slug":100,"title":101,"created_at":102},"214ab08b-5ce5-4b5c-8b72-47619d8675dd","why-small-models-are-winning-on-device-ai-zh","小模型為何吃下裝置端 AI","2026-03-26T07:36:30.488966+00:00",{"id":104,"slug":105,"title":106,"created_at":107},"785624b2-0355-4b82-adc3-de5e45eecd88","midjourney-v8-faster-images-higher-costs-zh","Midjourney V8 變快了，也變貴了","2026-03-26T07:52:03.562971+00:00",{"id":109,"slug":110,"title":111,"created_at":112},"cda76b92-d209-4134-86c1-a60f5bc7b128","xiaomi-mimo-trio-agents-robots-voice-zh","小米 MiMo 三模型瞄準代理、機器人與語音","2026-03-28T03:05:08.779489+00:00",{"id":114,"slug":115,"title":116,"created_at":117},"9e1044b4-946d-47fe-9e2a-c2ee032e1164","xiaomi-mimo-v2-pro-1t-moe-agents-zh","小米 MiMo-V2-Pro 登場：1T MoE 模型","2026-03-28T03:06:19.002353+00:00",{"id":119,"slug":120,"title":121,"created_at":122},"c4b6186f-bd84-4598-997e-c6e31d543c0d","cursor-composer-2-agentic-coding-model-zh","Cursor Composer 2 走向代理式寫碼","2026-03-28T03:13:06.422716+00:00",{"id":124,"slug":125,"title":126,"created_at":127},"e112e76f-ec3b-408f-810e-e93ae21a888a","apple-siri-gemini-distilled-models-zh","Apple Siri 牽手 Gemini 的真相","2026-03-29T04:52:57.886544+00:00",{"id":129,"slug":130,"title":131,"created_at":132},"c679b51f-194a-463b-87fc-7695256ff752","mimo-v2-pro-vs-omni-vs-flash-2026-zh","MiMo V2 Pro、Omni、Flash 怎麼選","2026-04-02T01:18:43.576128+00:00",{"id":134,"slug":135,"title":136,"created_at":137},"3b988fd7-6749-4f01-ba25-c0ad7486dc31","z-ai-glm-5v-turbo-design2code-claude-zh","GLM-5V-Turbo 在 Design2Code 贏了…","2026-04-02T04:03:36.31741+00:00"]