[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-five-ai-infra-frontiers-bessemer-2026-zh":3,"article-related-five-ai-infra-frontiers-bessemer-2026-zh":28,"series-industry-779f5798-9c39-4ce2-95d7-f0abfd24a695":83},{"id":4,"slug":5,"title":6,"content":7,"summary":8,"source":9,"source_url":10,"author":11,"image_url":12,"cover_image":12,"category":13,"language":14,"translated_content":11,"related_article_id":15,"keywords":16,"key_takeaways":11,"views":25,"created_at":26,"published_at":27,"topic_cluster_id":11},"779f5798-9c39-4ce2-95d7-f0abfd24a695","five-ai-infra-frontiers-bessemer-2026-zh","Bessemer 看準的 5 個 AI 基礎設施前線","\u003Cp>AI 基礎設施這兩年變很快。\u003Ca href=\"https:\u002F\u002Fwww.bvp.com\" target=\"_blank\" rel=\"noopener\">Bessemer Venture Partners\u003C\u002Fa> 在 2024 年押過 \u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\" target=\"_blank\" rel=\"noopener\">Anthropic\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Ffal.ai\" target=\"_blank\" rel=\"noopener\">Fal AI\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fwww.cursor.com\" target=\"_blank\" rel=\"noopener\">Cursor\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fwww.vapi.ai\" target=\"_blank\" rel=\"noopener\">Vapi\u003C\u002Fa>。到了 2026，它看的是另一件事。AI 不只要會答題，還要會記、會學、會做事。\u003C\u002Fp>\u003Cp>這個轉向很現實。第一代 AI infra，重點是更大模型、更多資料、更多訓練算力。第二代開始看模型上線後怎麼活。它有沒有記憶。它會不會從使用中變聰明。它能不能做延遲回饋的決策。它能不能便宜地跑在大量請求上。\u003C\u002Fp>\u003Cp>講白了，重心正在從 model building，移到 model operation。這也是為什麼 Bessemer 看的五個方向，會更像記憶系統、評測平台、RL 堆疊、推論優化層，還有 world model 基礎設施。這些東西聽起來沒那麼炫，但更接近真實產品。\u003C\u002Fp>\u003Ch2>1. 新 AI 堆疊先要記憶，不只要模型\u003C\u002Fh2>\u003Cp>第一個前線，是 Bessemer 說的 harness infra。意思很直白。AI 系統越做越像複合系統後，難題不再是回答一個 prompt。難題是讓模型拿到對的上下文、對的記憶、對的護欄。你要的是像員工，不是像很會接話的 autocomplete。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1775164388114-uo7t.png\" alt=\"Bessemer 看準的 5 個 AI 基礎設施前線\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>這件事對企業很重要。模型常見的錯，不是完全答錯，而是答得很像真的。它可能語氣對，事實錯。它可能偏離原本任務。它甚至會產出一段看起來合理，卻沒人立刻抓得出來的內容。Bessemer 的分析裡，約 78% 的 AI failure 是看不見的。這數字很刺眼。\u003C\u002Fp>\u003Cp>傳統監控工具只看 latency、error code、timeout。它看不到客服機器人默默誤解客戶。它也看不到內部 agent 一本正經地亂編 policy。這就是為什麼 memory、retrieval、context management、semantic eval，現在都在變成獨立類別。\u003C\u002Fp>\u003Cul>\u003Cli>78% 的 AI failure 被 Bessemer 描述成不可見\u003C\u002Fli>\u003Cli>93% 的失敗型態，就算模型更強也還在\u003C\u002Fli>\u003Cli>生產環境需要跨 session memory，不只是單輪 retrieval\u003C\u002Fli>\u003Cli>Semantic eval 正取代單純的讚和倒讚\u003C\u002Fli>\u003C\u002Ful>\u003Cp>這也解釋了工具市場的變化。團隊不再只靠手刻 vector database，或自己寫一套 retrieval 邏輯。大家開始要專門的長期記憶、觀測、judge-based evaluation。說真的，這比「再加一層 RAG」實際多了。\u003C\u002Fp>\u003Cp>如果你在做產品，這裡的訊號很清楚。AI 不缺會講話的模型。缺的是能把對話串起來的系統。誰能把上下文、記憶、權限、評測串好，誰就比較接近真正可用的 AI。\u003C\u002Fp>\u003Ch2>2. 持續學習，才不是凍結權重\u003C\u002Fh2>\u003Cp>第二個前線，是 continual learning。現在的大型 foundation model，訓練完就凍住了。它可以在 context 裡適應，但不會真的從使用中學習。這對長壽命產品是硬傷。客戶每天都在用同一個 agent，系統卻永遠像第一天上班。\u003C\u002Fp>\u003Cp>更現實的是成本。context window 一直變大，KV cache 也越來越貴。你可以把記憶塞滿，但帳單也會跟著塞滿。continual learning 想解這題。它讓模型能隨時間更新，還盡量不忘掉舊技能。\u003C\u002Fp>\u003Cp>Bessemer 提到的做法很多。有人做 inference-time learning。有人把長上下文壓成可重用的 memory structure。有人做更細的回饋迴路。核心想法都一樣。學習不該在訓練結束時停掉。\u003C\u002Fp>\u003Cblockquote>“Finally, AI is able to do productive work, and therefore the inflection point of inference has arrived.” — Jensen Huang, NVIDIA GTC 2026 keynote\u003C\u002Fblockquote>\u003Cp>這句話很有意思。因為 continual learning 只有在 AI 真正進到工作流後，才會變得重要。當系統開始天天做事，大家就會逼它變更準。靜態模型撐不久。你不用太浪漫，也能看出這件事。\u003C\u002Fp>\u003Cp>但這條路也很麻煩。模型如果能自己學，就得有 rollback、lineage tracking、隔離實驗、正式 benchmark。沒有這些控制，learning 很容易變成 silent regression。表面上有變聰明，實際上只是亂改。\u003C\u002Fp>\u003Ch2>3. RL 正從研究室走進產品\u003C\u002Fh2>\u003Cp>第三個前線，是 reinforcement learning 平台。這一段很實際。人類標註資料對第一波 AI 很有用，但它不擅長教 agent 做多步驟決策。尤其是那種延遲回饋的任務。像訂旅行、處理客服、跨工具跑流程，單次標註根本不夠。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1775164384578-590t.png\" alt=\"Bessemer 看準的 5 個 AI 基礎設施前線\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>所以 Bessemer 把 RL 看成下一階段的核心 infra。它提到的堆疊，包含 environment building、experience curation、RL-as-a-service、平台層工具。目標很簡單。讓模型透過互動學，不只是看例子學。\u003C\u002Fp>\u003Cp>和 s\u003Ca href=\"\u002Fnews\u002Fpreset-mcp-enterprise-controls-superset-zh\">uper\u003C\u002Fa>vised learning 比起來，RL infra 更髒，也更難。你要先做出像真的環境。你要設 reward function。你還要處理長 trajectory。這類東西很吃系統能力，也很吃耐心。說白了，這市場比較適合能扛複雜度的團隊。\u003C\u002Fp>\u003Cul>\u003Cli>人類標註還有用，但不夠教 agent 做決策\u003C\u002Fli>\u003Cli>RL 是透過互動學，不是看靜態例子學\u003C\u002Fli>\u003Cli>infra 範圍包含環境、reward、trajectory 工具\u003C\u002Fli>\u003Cli>生產 RL 需要比真實試錯更安全的實驗方式\u003C\u002Fli>\u003C\u002Ful>\u003Cp>這也是為什麼我覺得，RL 會先從工具層出現機會。市場要的不是更漂亮的 demo。市場要的是能模擬經驗、評分結果、降低出錯率的系統。這種東西一旦做對，黏性通常不低。\u003C\u002Fp>\u003Cp>你可以把它想成 AI 的駕訓班。不是只會背考題。是要上路，還要在不同路況下學會不撞車。這種能力，才會把 agent 從玩具拉進工作流程。\u003C\u002Fp>\u003Ch2>4. 推論，開始變成最貴的那一筆\u003C\u002Fh2>\u003Cp>第四個前線，是 inference。這一段其實最接地氣。前幾年 AI infra 花最多錢的地方，多半是 training。那時大家都在拼更大的模型。可是一旦 AI agent 開始進到 production，算力支出就會往 inference 偏。\u003C\u002Fp>\u003Cp>原因很簡單。推論決定 latency、throughput、每個任務的成本。模型再強，如果每次回應都太貴，產品數學就壞掉了。你不能只看 benchmark。你還得看帳單。這點很多團隊一開始都會忽略，後面才痛。\u003C\u002Fp>\u003Cp>Bessemer 提到 \u003Ca href=\"https:\u002F\u002Fwww.baseten.co\" target=\"_blank\" rel=\"noopener\">Baseten\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fwww.fireworks.ai\" target=\"_blank\" rel=\"noopener\">Fireworks AI\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fwww.together.ai\" target=\"_blank\" rel=\"noopener\">Together AI\u003C\u002Fa> 這些早期玩家。後面還有像 Tensor\u003Ca href=\"\u002Fnews\u002Fmeta-10b-el-paso-ai-data-center-plan-zh\">Me\u003C\u002Fa>sh、RadixArk、Inferact 這類新名字在往更深的最佳化走。重點不是誰永遠贏。重點是 inference 已經變成一級產品問題。\u003C\u002Fp>\u003Cul>\u003Cli>很多 AI 產品的 compute 支出，推論已接近訓練\u003C\u002Fli>\u003Cli>更低 latency 直接影響體驗和 unit economics\u003C\u002Fli>\u003Cli>routing、caching、scheduling 比單純放大模型更重要\u003C\u002Fli>\u003Cli>Edge 與 on-device inference 也越來越重要\u003C\u002Fli>\u003C\u002Ful>\u003Cp>這裡的訊號對開發者很直接。模型品質不是全部。你的 app 如果每問一次就燒一次錢，遲早會卡住。現在很多真正有價值的工程工作，都藏在 serving、routing、cache、batching 裡面。\u003C\u002Fp>\u003Cp>台灣團隊如果在做 AI 產品，我會很在意這件事。你可以先做出能跑的功能，但別忘了算每次請求的成本。很多產品不是輸在模型不夠強，是輸在每次呼叫都太貴。\u003C\u002Fp>\u003Ch2>5. World models 把 AI 推進模擬與實體\u003C\u002Fh2>\u003Cp>第五個前線，是 world models。這一段比較野，也比較有野心。前面幾段是在讓 AI 更會做軟體工作。world models 則是讓 AI 理解環境、物理、動作之間的關係。這對機器人、模擬、自治系統都很重要。\u003C\u002Fp>\u003Cp>這是另一種 infra 問題。你不再只問模型答得對不對。你要問它能不能預測結果、吸收回饋、在有後果的環境裡做事。這就需要更好的 simulator、更好的訓練迴圈，還有把 perc\u003Ca href=\"\u002Fnews\u002Fwill-nvidia-stock-recover-after-deepseek-zh\">ep\u003C\u002Fa>tion 接到 planning 的工具。\u003C\u002Fp>\u003Cp>Bessemer 的整體論點很清楚。AI infra 正從「腦」走向「經驗」。第一階段讓模型能說。下一階段要讓模型記得發生過什麼，從中學習，然後少一點手工規則。這個方向不浪漫，但很務實。\u003C\u002Fp>\u003Cp>如果你要找比較點，可以看 \u003Ca href=\"https:\u002F\u002Fwww.nvidia.com\u002Fen-us\u002Fgtc\u002F\" target=\"_blank\" rel=\"noopener\">NVIDIA GTC\u003C\u002Fa> 這類大會對 inference 和機器人堆疊的重視。再看 \u003Ca href=\"https:\u002F\u002Fopenai.com\u002Fresearch\" target=\"_blank\" rel=\"noopener\">OpenAI Research\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fdeepmind.google\u002Fresearch\u002F\" target=\"_blank\" rel=\"noopener\">Google DeepMind Research\u003C\u002Fa> 對 agent 與 world simulation 的投入。方向很像，但落地節奏不一樣。\u003C\u002Fp>\u003Ch2>產業脈絡：為什麼現在是這五個方向\u003C\u002Fh2>\u003Cp>這波變化不是突然冒出來的。模型能力先到一個門檻，大家才發現真正難的是上線後的系統工程。從 2023 到 2025，市場一路把焦點放在更大的 model、更長的 context、更快的訓練。到了現在，瓶頸開始轉到運作層。\u003C\u002Fp>\u003Cp>這也很符合企業採用的節奏。POC 很容易。真正難的是 production。你要權限控管、資料隔離、觀測、成本控管、回滾機制。只要 AI 真進到工作流，這些問題就全冒出來。Bessemer 看的五個方向，剛好都踩在這些痛點上。\u003C\u002Fp>\u003Cp>我自己的判斷很簡單。memory 和 inference 會先出現明顯贏家。因為它們已經有需求、有預算、有買家。continual learning 和 RL 會慢一點，但如果做對，會很有黏性。world models 則比較像長線賽道，適合有研究與系統能力的團隊。\u003C\u002Fp>\u003Ch2>結尾：先看哪裡會先變現\u003C\u002Fh2>\u003Cp>如果你在做 AI infra，我會先盯 memory 和 inference。這兩塊最接近真實痛點，也最容易算出 ROI。再來才是 continual learning 和 RL。它們比較難，但一旦進到企業流程，價值會很硬。\u003C\u002Fp>\u003Cp>接下來 12 到 18 個月，我會看兩件事。第一，哪個方向先長出可重複的商業模式。第二，哪個方向能把 demo 變成 production。你如果正在選題，別只問模型多強。先問它能不能記、能不能學、能不能便宜地跑。\u003C\u002Fp>","Bessemer 2026 AI infra 藍圖指向 memory、continual learning、RL、inference 與 world models。重點不是更大模型，而是讓 AI 真正進到生產環境。","www.bvp.com","https:\u002F\u002Fwww.bvp.com\u002Fatlas\u002Fai-infrastructure-roadmap-five-frontiers-for-2026",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1775164388114-uo7t.png","industry","zh","15c2f00f-4c48-4580-a13e-74626eb520f7",[17,18,19,20,21,22,23,24],"AI 基礎設施","Bessemer Venture Partners","memory","continual learning","reinforcement learning","inference","world models","AI infra",7,"2026-04-02T21:12:39.852377+00:00","2026-04-02T21:12:39.792+00:00",{"tags":29,"relatedLang":42,"relatedPosts":46},[30,31,33,35,37,39,40],{"name":22,"slug":22},{"name":20,"slug":32},"continual-learning",{"name":18,"slug":34},"bessemer-venture-partners",{"name":23,"slug":36},"world-models",{"name":24,"slug":38},"ai-infra",{"name":19,"slug":19},{"name":21,"slug":41},"reinforcement-learning",{"id":15,"slug":43,"title":44,"language":45},"five-ai-infra-frontiers-bessemer-2026-en","Five AI Infra Frontiers Bessemer Expects for 2026","en",[47,53,59,65,71,77],{"id":48,"slug":49,"title":50,"cover_image":51,"image_url":51,"created_at":52,"category":13},"0231f359-f786-4e6c-8104-d3fae443f98b","4-chipotle-promo-details-for-members-zh","4 個 Chipotle 會員活動重點","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780540375071-5xa3.png","2026-06-04T02:32:19.54736+00:00",{"id":54,"slug":55,"title":56,"cover_image":57,"image_url":57,"created_at":58,"category":13},"39e4c1b2-4a8d-4baf-86eb-f65d4f6c3624","why-chipotle-53000-burrito-stunt-smart-brand-marketing-zh","為什麼 Chipotle 的 53,000 捲餅活動是聰明的品牌行銷","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780538579630-nkln.png","2026-06-04T02:02:28.454411+00:00",{"id":60,"slug":61,"title":62,"cover_image":63,"image_url":63,"created_at":64,"category":13},"53955aa8-9120-41c1-b342-6ca40e24b6ee","apples-gemini-deal-turns-cloud-ai-into-local-ai-zh","Apple 把雲端 AI 拆成本機 AI","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780535908899-g9ua.png","2026-06-04T01:18:03.319604+00:00",{"id":66,"slug":67,"title":68,"cover_image":69,"image_url":69,"created_at":70,"category":13},"a1119341-06e2-47ed-95f0-192f89c277a7","sec-draft-plan-puts-crypto-rules-first-zh","SEC草案把加密規則排第一","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780534108464-yi2d.png","2026-06-04T00:48:00.749142+00:00",{"id":72,"slug":73,"title":74,"cover_image":75,"image_url":75,"created_at":76,"category":13},"87a8a5d1-7284-4c58-aa53-9f353d5a2800","why-jensen-huang-keynote-bigger-than-nvidia-zh","為什麼 Jensen Huang 的 keynote 比 Nvidia 更重要","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780530468418-zi6e.png","2026-06-03T23:47:22.014083+00:00",{"id":78,"slug":79,"title":80,"cover_image":81,"image_url":81,"created_at":82,"category":13},"b5d4728c-ee2a-4df6-93c2-42e814d51ea1","why-smci-rally-is-about-supply-not-just-ai-zh","為什麼 SMCI 的漲勢主要是供給故事，不只是 Agentic AI","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780529579886-q16r.png","2026-06-03T23:32:28.626882+00:00",[84,89,94,99,104,109,114,119,124,129],{"id":85,"slug":86,"title":87,"created_at":88},"ee073da7-28b3-4752-a319-5a501459fb87","ai-in-2026-what-actually-matters-now-zh","2026 AI 真正重要的事","2026-03-26T07:09:12.008134+00:00",{"id":90,"slug":91,"title":92,"created_at":93},"83bd1795-8548-44c9-9a7e-de50a0923f71","trump-ai-framework-power-speech-state-preemption-zh","川普 AI 框架瞄準電力、言論與州權","2026-03-26T07:12:18.695466+00:00",{"id":95,"slug":96,"title":97,"created_at":98},"ea6be18b-c903-4e54-97b7-5f7447a612e0","nvidia-gtc-2026-big-ai-announcements-zh","NVIDIA GTC 2026 重點拆解","2026-03-26T07:14:26.62638+00:00",{"id":100,"slug":101,"title":102,"created_at":103},"4bcec76f-4c36-4daa-909f-54cd702f7c93","claude-users-spreading-out-and-getting-better-zh","Claude 用戶更分散，也更會用","2026-03-26T07:22:52.325888+00:00",{"id":105,"slug":106,"title":107,"created_at":108},"bd903b15-2473-4178-9789-b7557816e535","openclaw-raises-hard-question-for-ai-models-zh","OpenClaw 逼問 AI 模型價值","2026-03-26T07:24:54.707486+00:00",{"id":110,"slug":111,"title":112,"created_at":113},"eeac6b9e-ad9d-4831-8eec-8bba3f9bca6a","gap-google-gemini-checkout-fashion-search-zh","Gap 把結帳搬進 Gemini","2026-03-26T07:28:23.937768+00:00",{"id":115,"slug":116,"title":117,"created_at":118},"0740e53f-605d-4d57-8601-c10beb126f3c","google-pushes-gemini-transition-to-march-2026-zh","Google 把 Gemini 轉換延到 2026 年 3…","2026-03-26T07:30:12.825269+00:00",{"id":120,"slug":121,"title":122,"created_at":123},"e660d801-2421-4529-8fa9-86b82b066990","metas-llama-4-benchmark-scandal-gets-worse-zh","Meta Llama 4 分數風波又擴大","2026-03-26T07:34:21.156421+00:00",{"id":125,"slug":126,"title":127,"created_at":128},"183f9e7c-e143-40bb-a6d5-67ba84a3a8bc","accenture-mistral-ai-sovereign-enterprise-deal-zh","Accenture 攜手 Mistral AI 賣主權 AI","2026-03-26T07:38:14.818906+00:00",{"id":130,"slug":131,"title":132,"created_at":133},"191d9b1b-768a-478c-978c-dd7431a38149","mistral-ai-faces-its-hardest-year-yet-zh","Mistral AI 迎來最硬的一年","2026-03-26T07:40:23.716374+00:00"]