[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-handoff-humanoid-control-planner-friendly-zh":3,"article-related-handoff-humanoid-control-planner-friendly-zh":30,"series-research-47517f79-474e-479b-a1cb-a028e00e01f4":82},{"id":4,"slug":5,"title":6,"content":7,"summary":8,"source":9,"source_url":10,"author":11,"image_url":12,"cover_image":12,"category":13,"language":14,"translated_content":11,"related_article_id":15,"keywords":16,"key_takeaways":22,"views":26,"created_at":27,"published_at":28,"topic_cluster_id":29},"47517f79-474e-479b-a1cb-a028e00e01f4","handoff-humanoid-control-planner-friendly-zh","HANDOFF 讓人形機器人更好控","\u003Cp data-speakable=\"summary\">HANDOFF 用更精簡的控制介面，把三種專家能力蒸餾進單一人形控制器，讓規劃器更容易下指令。\u003C\u002Fp>\u003Cul>\u003Cli>\u003Cstrong>研究機構\u003C\u002Fstrong>：arXiv 摘要未明確標註\u003C\u002Fli>\u003Cli>\u003Cstrong>核心數據\u003C\u002Fstrong>：摘要無公開 benchmark 數字\u003C\u002Fli>\u003Cli>\u003Cstrong>突破點\u003C\u002Fstrong>：上下文門控蒸餾\u003C\u002Fli>\u003C\u002Ful>\u003Cp>這篇論文在解的問題很直接：人形機器人要做任務，規劃和控制之間常常講不同語言。規劃器想的是「去那裡、拿起來、站穩」，控制器卻常常要吃很密的運動參考。HANDOFF 想把這個中間層縮小，做成一個更適合規劃器使用的控制介面。\u003C\u002Fp>\u003Cp>對開發者來說，這不是抽象的學術修辭，而是實作上的痛點。當控制介面太細，規劃器就得自己補出很多低階細節；當介面太粗，又會讓機器人缺乏表達能力。HANDOFF 的定位，就是在這兩者中間找一個比較好用的點。\u003C\u002Fp>\u003Ch2>它想解的，是規劃器和控制器之間的落差\u003C\u002Fh2>\u003Cp>摘要把瓶頸講得很清楚：既有的人形全身控制器，通常需要密集的運動學或空間參考。這類輸入對已經知道怎麼動的系統很友善，但對只知道任務語意的規劃器來說就很彆扭。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780726684697-uhrx.png\" alt=\"HANDOFF 讓人形機器人更好控\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>想像一下，規劃器知道的是高層意圖，例如移動、抓取、恢復平衡；但控制器要的卻可能是更細的姿態、軌跡或身體配置。中間這段翻譯工作如果做得不好，整個機器人系統就會卡住。HANDOFF 的\u003Ca href=\"\u002Fnews\u002Flinux-kernel-hobby-project-core-infrastructure-zh\">核心\u003C\u002Fa>，就是把這段翻譯變得更短、更穩定。\u003C\u002Fp>\u003Cp>這也解釋了為\u003Ca href=\"\u002Fnews\u002Fwhy-web3-is-wrong-about-its-own-future-zh\">什麼\u003C\u002Fa>這篇論文會把「介面」放在第一位。它不是先追求一個更大、更複雜的 policy，而是先問：規劃器到底該怎麼跟人形機器人說話，才不會每次都要重寫一套低階控制細節？\u003C\u002Fp>\u003Ch2>HANDOFF 的方法，白話講是什麼\u003C\u002Fh2>\u003Cp>方法本身可以拆成兩個重點。第一，作者設計了一個更緊湊、明確的人形控制介面。第二，他們不是把這個控制器從零開始硬練出來，而是把多個專家能力蒸餾進同一個學生模型。\u003C\u002Fp>\u003Cp>這些專家不是同一種人，而是各有分工：一個負責全身運動追蹤，資料還帶有安全過濾；一個負責行走；一個負責跌倒恢復。也就是說，作者不是假設一個單一模型可以自然學會所有能力，而是先把不同技能拆開，再想辦法整合。\u003C\u002Fp>\u003Cp>整合的方式是 multi-teacher KL distillation，再加上 context-conditioned gating。前者是蒸餾方法，後者則像是動態分配權重的開關：系統會根據情境，決定哪些專家的影響力要大一點，哪些要小一點。這讓學生控制器不是死背技能，而是能依照情境切換側重。\u003C\u002Fp>\u003Cp>從架構角度看，這是一種 mixture-of-experts 的思路，但重點不只是「多專家」，而是「有上下文的多專家」。如果沒有 gating，幾個專家的知識可能只是混在一起；有了 gating，系統才比較像是在不同情境下調用不同能力。\u003C\u002Fp>\u003Cp>這個設計也很符合人形機器人的現實需求。走路、追蹤、站穩、跌倒恢復，本來就不是同一種控制問題。把它們硬塞進一個完全平坦的 policy，通常不會比拆開再整合更好。HANDOFF 的做法，是把複雜性留在訓練階段，讓執行階段更單純。\u003C\u002Fp>\u003Ch2>論文實際證明了什麼\u003C\u002Fh2>\u003Cp>摘要給出的結果，重點放在 Unitree G1 上。HANDOFF 被描述為能達到 state-of-the-art 的 velocity tracking，同時還擁有「最大的 robust manipulation workspace 之一」。這是原始資料裡唯一明確的性能結論，但摘要沒有公開完整 \u003Ca href=\"\u002Ftag\u002Fbenchmark\">benchmark\u003C\u002Fa> 數字，所以沒辦法從這裡直接比較差距有多大。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780726681581-8qvv.png\" alt=\"HANDOFF 讓人形機器人更好控\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>另一個值得注意的點，是它不只停留在模擬。摘要說作者在硬體上展示了多個由自然語言驅動的任務 roll-out，而且沒有使用 task-specific data，也沒有做 controller fine-tuning。這代表它想證明的不是單一技能分數，而是整個系統的可組合性。\u003C\u002Fp>\u003Cp>這裡的訊號很重要。很多機器人方法在論文裡看起來很漂亮，但一上真機就要重新調參、重訓、換資料。HANDOFF 的摘要至少主張了一件事：它的介面和蒸餾後控制器，能讓 VLM 驅動的 agentic planner 直接下任務，而不需要針對每個任務再特調控制器。\u003C\u002Fp>\u003Cp>不過，這篇摘要也很克制。它沒有提供成功率、延遲、workspace 的實際數值，也沒有列出完整對照組。換句話說，摘要層級只能知道它「做得到」，還不能完整判斷它「贏多少」或「在哪些條件下會失效」。\u003C\u002Fp>\u003Ch2>為什麼這對開發者有意義\u003C\u002Fh2>\u003Cp>如果你在做機器人軟體，這篇最值得看的不是某個單點技巧，而是系統切法。HANDOFF 把 planner 和 controller 之間的邊界，當成一個需要被設計的產品介面，而不是理所當然的實作細節。這種思路很像做 \u003Ca href=\"\u002Ftag\u002Fapi\">API\u003C\u002Fa>：介面好不好用，常常比底層實作更決定整體體驗。\u003C\u002Fp>\u003Cp>對 agentic robotics 來說，這尤其重要。當語言、視覺、規劃和控制都要串在一起時，最容易爆掉的地方往往不是單一模組，而是模組之間的接縫。如果控制介面太硬，規劃器就會很痛苦；如果介面太鬆，控制器就會失去約束。HANDOFF 想做的，就是把這個接縫收斂成一個比較穩定的中介層。\u003C\u002Fp>\u003Cp>它的多教師蒸餾也提供了一個實用模式。真實的人形行為本來就不是一種技能，而是一包技能的組合，而且這些技能常常來自不同資料、不同安全條件、不同訓練目標。把它們蒸餾到同一個 context-gated student，等於是在維持多樣性的同時，降低部署時的複雜度。\u003C\u002Fp>\u003Cp>對工程團隊來說，這種做法的吸引力很明顯：你不一定要為追蹤、行走、恢復各自維護一套完全獨立的控制堆疊。若介面設計得夠好，理論上可以讓上層規劃更容易接上去，底層執行也更一致。這對要做長鏈任務的人形系統，會比單純追求單一 benchmark 更有實際價值。\u003C\u002Fp>\u003Ch2>它的限制，也很明確\u003C\u002Fh2>\u003Cp>首先，摘要沒有公開完整 benchmark 細節。這表示我們目前只能知道它在 Unitree G1 上有幾個正向結論，卻無法從摘要判斷提升幅度、穩定性邊界，或是跟其他方法相比的具體優勢。\u003C\u002Fp>\u003Cp>其次，摘要沒有說這套方法能不能順利跨到不同機型。它展示的是 Unitree G1，但沒有交代是否能轉移到別的人形平台、不同感測器配置，或不同任務族群。對想把方法拿去落地的人來說，這是很關鍵的空白。\u003C\u002Fp>\u003Cp>第三個問題是 gating 在新情境下會怎麼表現。mixture-of-experts 很強，但前提是 gate 要判斷得對。當機器人遇到訓練分佈外的狀況時，該偏向哪個專家、要不要切換，這些都會影響結果。摘要沒有回答這點，所以仍需要看全文。\u003C\u002Fp>\u003Cp>也因為這些限制，HANDOFF 比較像是一個架構\u003Ca href=\"\u002Fnews\u002Ftaillor-protects-key-directions-continual-finetuning-zh\">方向\u003C\u002Fa>的證明，而不是一份完整的性能報告。它證明的是：把控制介面做小、把多種專家能力整合到一個 context-aware 的學生模型裡，確實可以支撐真機上的自然語言任務執行。\u003C\u002Fp>\u003Ch2>這篇論文真正傳達的訊號\u003C\u002Fh2>\u003Cp>HANDOFF 最重要的訊號，不是它又做出了一個更大的模型，而是它把「人形機器人怎麼接任務」這件事，提升成第一級設計問題。這很像把資料庫 schema 或 API contract 放到產品核心位置：你不先處理好接法，後面再強的能力都很難順利組合。\u003C\u002Fp>\u003Cp>從研究角度看，它把三種互補能力——全身追蹤、行走、跌倒恢復——收斂成一個可被規劃器使用的控制器。從系統角度看，它試圖讓 VLM 驅動的 \u003Ca href=\"\u002Ftag\u002Fagent\">agent\u003C\u002Fa> 不必碰太多低階控制細節。從部署角度看，它至少在摘要裡聲稱自己能在真機上跑自然語言任務，而且不靠 task-specific data 和額外 fine-tuning。\u003C\u002Fp>\u003Cp>所以，如果你關心的是人形機器人怎麼從「能動」走向「好接任務」，這篇的價值就在這裡。它不是單純把控制做得更強，而是把控制變得更好用。對開發者來說，這種改變往往比多幾個百分點的分數更接近真正能落地的系統。\u003C\u002Fp>\u003Cp>總結一句，HANDOFF 證明了人形控制可以被整理成更適合規劃器使用的介面，並透過上下文門控的多教師蒸餾，把多種專家能力整合進單一控制器。摘要沒有給完整數字，但它已經清楚指出：在人形機器人裡，介面本身就是性能的一部分。\u003C\u002Fp>\u003Cul>\u003Cli>它把人形控制的關鍵，放在規劃器與控制器之間的介面設計。\u003C\u002Fli>\u003Cli>它用上下文門控蒸餾，把追蹤、行走、恢復整合成單一控制器。\u003C\u002Fli>\u003Cli>它在 Unitree G1 上展示真機任務 roll-out，但摘要未公開完整數字。\u003C\u002Fli>\u003C\u002Ful>","HANDOFF 用更精簡的控制介面，把三種專家能力蒸餾進單一人形控制器，讓規劃器更容易下指令。","arxiv.org","https:\u002F\u002Farxiv.org\u002Fabs\u002F2606.06493",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780726684697-uhrx.png","research","zh","cb4d09b6-0301-417e-8b84-11cd25ff4ae1",[17,18,19,20,21],"humanoid control","mixture-of-experts","knowledge distillation","whole-body control","robot planning",[23,24,25],"把人形控制介面做得更精簡，能降低規劃器下指令的難度。","用多教師蒸餾加上下文門控，可把不同專家技能整合成單一控制器。","摘要只提供高層結果，沒有公開完整 benchmark 數字與跨平台細節。",0,"2026-06-06T06:17:35.215424+00:00","2026-06-06T06:17:35.198+00:00","0c35a120-52fc-41fc-afa3-d404eb934158",{"tags":31,"relatedLang":41,"relatedPosts":45},[32,34,35,37,39],{"name":21,"slug":33},"robot-planning",{"name":18,"slug":18},{"name":17,"slug":36},"humanoid-control",{"name":20,"slug":38},"whole-body-control",{"name":19,"slug":40},"knowledge-distillation",{"id":15,"slug":42,"title":43,"language":44},"handoff-humanoid-control-planner-friendly-en","HANDOFF makes humanoid control more planner-friendly","en",[46,52,58,64,70,76],{"id":47,"slug":48,"title":49,"cover_image":50,"image_url":50,"created_at":51,"category":13},"33d21f7f-481d-43d9-9a1c-a2e5badcd84b","bis-stablecoin-usable-buffers-regulation-zh","BIS 把穩定幣規則變成可用緩衝","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780737502594-jk2b.png","2026-06-06T09:17:56.366473+00:00",{"id":53,"slug":54,"title":55,"cover_image":56,"image_url":56,"created_at":57,"category":13},"a4cb421e-464e-4933-9e1c-6371d3cd1503","prevent-catastrophic-forgetting-llm-fine-tuning-zh","如何防止 LLM 微調災難性遺忘","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780730281470-8i97.png","2026-06-06T07:17:28.426709+00:00",{"id":59,"slug":60,"title":61,"cover_image":62,"image_url":62,"created_at":63,"category":13},"db0b0788-6656-4a33-b51d-f09e7821af36","code2lora-repo-specific-adapters-code-models-en-zh","Code2LoRA 讓模型學會倉庫脈絡","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780727591717-goec.png","2026-06-06T06:32:45.978642+00:00",{"id":65,"slug":66,"title":67,"cover_image":68,"image_url":68,"created_at":69,"category":13},"988128e2-d1e8-4643-b565-0bb61202e62e","taillor-protects-key-directions-continual-finetuning-zh","TailLoR 用光譜方向守住舊知識","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780725774632-8seh.png","2026-06-06T06:02:29.73588+00:00",{"id":71,"slug":72,"title":73,"cover_image":74,"image_url":74,"created_at":75,"category":13},"a4cf24e5-b958-4f91-bdca-2f1a57e81aef","why-benchmark-leaderboards-are-wrong-about-model-logic-zh","為什麼基準排行榜看錯了模型邏輯","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780673571153-x7yi.png","2026-06-05T15:32:23.043639+00:00",{"id":77,"slug":78,"title":79,"cover_image":80,"image_url":80,"created_at":81,"category":13},"4a829d2a-24a3-42dd-8be4-49e5ab35435a","why-prompt-engineering-is-wrong-about-2026-zh","為什麼 2026 年 prompt engineering 錯了","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780661884287-ow45.png","2026-06-05T12:17:19.813402+00:00",[83,88,93,98,103,108,113,118,123,128],{"id":84,"slug":85,"title":86,"created_at":87},"f18dbadb-8c59-4723-84a4-6ad22746c77a","deepmind-bets-on-continuous-learning-ai-2026-zh","DeepMind 押注 2026 連續學習 AI","2026-03-26T08:16:02.367355+00:00",{"id":89,"slug":90,"title":91,"created_at":92},"f4a106cb-02a6-4508-8f39-9720a0a93cee","ml-papers-of-the-week-github-research-desk-zh","每週 ML 論文清單，為何紅到 GitHub","2026-03-27T01:11:39.284175+00:00",{"id":94,"slug":95,"title":96,"created_at":97},"c4f807ca-4e5f-47f1-a48c-961cf3fc44dc","ai-ml-conferences-to-watch-in-2026-zh","2026 AI 研討會投稿時程整理","2026-03-27T01:51:53.874432+00:00",{"id":99,"slug":100,"title":101,"created_at":102},"cf046742-efb2-4753-aef9-caed5da5e32e","adaptive-block-scaled-data-types-zh","IF4：神經網路量化的聰明選擇","2026-03-31T06:00:36.990273+00:00",{"id":104,"slug":105,"title":106,"created_at":107},"53a0dc54-0371-4e40-8d5e-74e94a73840c","geometry-aware-similarity-metrics-for-neural-representations-zh","超越距離測量：用微分幾何重新理解神經網路","2026-03-31T06:01:01.241968+00:00",{"id":109,"slug":110,"title":111,"created_at":112},"fee7d472-a775-4b1d-bbc2-1e8bca1bbf8b","on-the-fly-repulsion-in-the-contextual-space-for-rich-divers-zh","讓AI繪圖更有創意：用排斥力提升生成多樣性","2026-03-31T06:01:25.439673+00:00",{"id":114,"slug":115,"title":116,"created_at":117},"a9901203-d69b-447b-8854-15d14eab32b4","vision-aided-beam-prediction-cnn-eca-zh","影像輔助波束預測升級 CNN","2026-04-01T10:00:25.8073+00:00",{"id":119,"slug":120,"title":121,"created_at":122},"b55e7dd4-0a24-4b3d-804d-b0309a03f498","triple-band-fss-mimo-antenna-sub-6-ghz-zh","三頻 FSS MIMO 天線瞄準 sub-6 GHz","2026-04-01T13:18:36.857305+00:00",{"id":124,"slug":125,"title":126,"created_at":127},"f68290bd-e7f3-4b30-ba22-dcd4e0130a66","openclaw-1299-repos-eight-weeks-analysis-zh","OpenClaw 1299 個 Repo 的資料解讀","2026-04-02T05:03:45.208411+00:00",{"id":129,"slug":130,"title":131,"created_at":132},"ed9f80eb-eb02-4d35-8ad4-0ddf428751dd","beam-coherence-aware-combining-mmwave-mimo-zh","毫米波 MIMO 的雙階合併法","2026-04-02T05:27:26.897188+00:00"]