Google I/O 把 Search 變代理人

OraCore Editors

返回首頁

[TOOLS] 2026年6月6日10 分鐘閱讀OraCore 編輯部

Google I/O 把 Search 變代理人

我把 Google I/O 拆成可抄的工作流模板：Search、Gemini、Spark 和智慧眼鏡怎麼從問答變成可委派的代理人。

Gemini

分享 LinkedIn

我把 Google I/O 拆成可抄的工作流模板：Search、Gemini、Spark 和智慧眼鏡怎麼從問答變成可委派的代理人。

我看 Google 這幾年一直在塞 AI 功能，看到後來真的有點膩。每次 demo 都很會講，輪到我自己用就開始漏氣：問一題還行，追問就失憶；要它幫我整理事情，最後只剩一堆漂亮廢話。最煩的是，它看起來像有在做事，實際上只是把我原本要做的功課換個介面再丟回來。這種東西拿去 keynote 很好看，拿來撐日常工作就很尷尬。

所以這次我看 Google I/O，第一個不是看名字，而是看它到底想改什麼工作流。原始整理我主要參考 Wirecutter 的回顧，作者是 Caitlin McGarry 和 Brenda Stolyar。它沒有給我一堆品牌糖衣，反而直接把重點拆成 Search、Gemini、Spark 和眼鏡，這比較像我想看的東西。

我先講結論：Google 這次不是在加一個聊天框而已，它是在把「問一個東西」推向「委派一件事」。這差很多。前者是查資料，後者是把事情交出去。只要方向真的是這樣，那我們看它的方式就不能只看模型多大、名稱多炫，而是要看它有沒有真的進到工作流裡。

Search 不再只是輸入框，這件事很重要

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析，直送信箱。不定期，不騷擾。

不會寄垃圾信，隨時可取消。

“The biggest change rolling out today is a redesigned ‘intelligent’ search box that will greet you on the Google homepage.”

翻譯一下就是，Google 想把搜尋框從「關鍵字欄位」改成「對話起點」。它會更願意接長句、接上下文、接追問，甚至把你一路帶進 AI Mode。這不是小改版，這是在改人怎麼跟搜尋互動。

我以前最煩的就是很多 AI 搜尋工具假裝能聊天，結果第一題答得像樣，第二題開始就像換了一個路人。Google 這次比較聰明的地方是，它沒有把新互動硬塞到新 app，而是直接塞回大家本來就會用的首頁。這種做法很土，但有效，因為它降低了學習成本。

更細一點看，這個搜尋框其實在教育使用者怎麼下 prompt。以前大家被訓練成要把需求壓縮成幾個字，像在跟機器吵架。現在它鼓勵你講完整句子，甚至把背景一起丟進去。這是很大的使用習慣轉向，因為它默默把「搜尋」變成「描述需求」。

我之前做 vendor research 就碰過這個痛點。一次性答案很快，但一旦市場有變動，整份整理立刻過期。真正有用的，不是回答一次，而是能持續追蹤、再濃縮成我能掃過去的更新。這也是 Google 這次比較像真的在解問題的地方。

實操上，我會這樣拆：

先讓使用者用自然語言講完整意圖，不要急著叫他選 filter。
把追問留在同一個介面，別逼人重新開一個流程。
只有當需求真的變細時，才切到結構化欄位。

如果你在做搜尋產品，這個方向很值得抄：先接住粗需求，再慢慢收斂，不要一開始就拿表單嚇人。

Google 終於把 agent 講得像能做雜事了

“Google Spark is a new ‘24/7 personal agent’ built into Gemini.”

白話就是，Google 想做的不是你問它才動，而是它能在背景裡盯事情、抓訊號、幫你處理一些瑣碎但很煩的協調工作。文章裡提到 Spark 可以從 email 抓 Google Docs，串第三方 app，像 OpenTable、Spotify、Uber，還能把家庭行程、檔案更新這些高優先事項整理出來。

這段我就比較有感了。因為我早就受夠那種只會回答問題的 assistant。多數人根本不需要一個會講話的搜尋引擎，他們需要的是一個能幫忙收拾事情的協調員。有人改會議時間、有人丟檔案、有人臨時要訂位，這些事情單獨看都不難，但串起來就很煩。agent 真正有價值的地方，就是把這種碎事接起來。

但我也不會太快高潮，因為這種東西最容易翻車的就是權限。它要能幫你做事，就得看得到你的資料；它要能幫你下單，就得能動你的帳號。Google 說使用者可以控制它能碰什麼，這是正確答案，但真正的關鍵是控制介面要不要人話。設定如果寫得像法律條文，大家不是亂開就是直接放棄。

實操上我會這樣設計：

先把它能看什麼、能做什麼，用白話列出來。
讀取權限和執行權限分開，別混在一起。
凡是會送出訊息、付款、下單的動作，都要保留人工確認。

我自己做自動化時最怕的不是它不聰明，而是它太敢做。能省時間的 automation，前提是邊界清楚；不然它只是把 cleanup 丟給我。Spark 這次看起來就是 Google 想往「有邊界的常駐代理」走，這比空喊 autonomous 靠譜一點。

而且它還有一個平台意味很重的地方：如果 Gmail、Docs、第三方服務都接進去，Google 就不只是索引你的資料，它開始在中介你的操作。這件事對開發者很重要，因為你以後做產品，可能不是在跟 Google 的搜尋競爭，而是在跟它的工作入口競爭。

智慧眼鏡這次終於不像玩具了

“You’ll be able to ask Gemini for information about your surroundings and receive detailed directions.”

翻譯一下就是，Google 和 Samsung 想把智慧眼鏡做成真的能用，而不是只會拍片的奇怪玩具。文章提到這副眼鏡有內建喇叭、麥克風、相機，而且能跟 iPhone 和 Android 一起用。更重要的是，裡面跑的是 Gemini，不是什麼降級版 sidecar 模型。

我對智慧眼鏡一直很有怨氣，因為這類 demo 通常只有兩種：一種是戴在臉上的攝影機，另一種是穿戴式尷尬。這次至少方向比較務實。Wirecutter 也拿它跟 Meta 的 Ray-Ban AI glasses 比，重點不是硬體炫不炫，而是 assistant 夠不夠強。這很合理，因為硬體只是載具，AI 不行的話，眼鏡就只是昂貴臉部裝飾。

文章裡我最想試的反而是很日常的流程：用語音透過 DoorDash 點咖啡，或把食譜裡的材料直接加進購物清單。這種任務才像眼鏡該做的事，因為它短、即時、而且你手上通常真的不方便掏手機。

如果你在做穿戴式或語音介面，我會很直接地說：不要再追求那種「哇」一下的展示，去做使用者本來就會在走路、拿東西、看環境時做的事。導航、購物清單、快速下單、看見什麼就查什麼，這些才是對的場景。其他太花的功能，通常只是把複雜度搬到臉上。

Google 和 Samsung 目前還沒講價格跟上市時間，這很煩但也正常。比較值得注意的是它們找了 Samsung、Warby Parker、Gentle Monster 這些合作對象。這代表 Google 很清楚，這東西如果長得像實驗室樣品，正常人根本不會戴出門。

命名亂成一團，不是小事

“Google announced a slew of new AI tools… Many of them were confusingly named.”

也就是說，Google 內部可能知道每個名字代表什麼，但外面的人只會看到一坨名詞：Spark、Gemini 3.5 Flash、Omni、Antigravity。這不是單純的品牌問題，這是產品策略跟使用者理解沒對齊。你如果要我記這些名詞，我就先累了。

我不是在挑字眼。對開發者工具來說，命名就是介面的一部分。你如果連名字都讓人搞不清楚，那我根本不想繼續研究。Wirecutter 那篇厲害的地方，就是它把一堆名稱翻回實際用途，讓我知道哪些是模型、哪些是產品、哪些是功能。

實操上我會這樣做：

模型名、產品名、功能名分開，不要全部混著叫。
UI 上直接寫使用者結果，不要只寫內部架構。
文件裡再放技術名，別把使用者當成要背你們架構圖的人。

我自己的經驗是，名字一亂，整個產品就會開始長出一堆解釋成本。每個人都要先問「這到底是哪個東西」，那就代表你的產品還沒站穩。Google 這次的 AI 核心如果要鋪到 Search、Spark、眼鏡三條線，差異就必須靠行為說話，不然最後只會變成同一個助手換三套皮。

真正的標準很無聊：有沒有幫我省時間

“As always, you’ll need to check the AI’s work to confirm that it’s accurate.”

翻譯一下就是，Google 自己也知道這些東西還是會出錯，所以你不要把方向盤直接丟掉。這句話很誠實，但也把標準講死了：不是看它多會講，而是看它有沒有減少重工。

我現在評 AI 功能都用很土的標準。搜尋如果能讓我少改三次 query，它就有用。agent 如果能幫我持續盯更新，它就有用。眼鏡如果能讓我少掏一次手機，它就有用。只要它開始製造新的驗證成本，立刻打回原形。

所以我會這樣檢查任何 agentic workflow：

它到底是省掉哪一步？
它有沒有把工作從人手上搬到另一個地方？
它失敗時，是不是會留下可回收的草稿，而不是亂送出東西？

這也是我覺得這次 Google I/O 值得拆的原因。它不是因為發了很多新玩具，而是因為它終於比較明確地把 AI 對準真實工作：搜尋、監控、協調、下單、看環境。這些都還不完美，但方向夠清楚了，已經可以拿來設計自己的產品和 prompt。

老實講，我寧可看一個方向不那麼漂亮、但能拆解的產品，也不想再看那種滿口願景、最後什麼都接不起來的 demo。對開發者來說，能抄的不是口號，是工作流。

可抄的模板

# 把 AI 產品拆成 agentic workflow 的模板（可直接貼到筆記或 PRD）

## 1. 先定義它不是什麼
- 不是「更會聊天的 chatbot」
- 不是「只會回答一次的搜尋框」
- 不是「看起來很忙但不會做事的 demo」

## 2. 這個功能真正要改變的工作流
- 使用者原本要做的事：________________
- 現在希望 AI 幫忙接走的步驟：________________
- 需要持續監控的訊號：________________
- 需要跨 app 協調的動作：________________

## 3. 權限與邊界
- 這個 agent 可以讀取：________________
- 這個 agent 可以執行：________________
- 需要人工確認的動作：________________
- 失敗時要回傳的狀態：________________

## 4. 介面設計原則
- 先讓使用者用自然語言描述需求
- 再在同一個介面內做追問
- 只有在需要精準控制時才切換成表單或 filter
- 不要把模型名當成使用者要記的東西

## 5. 評估標準
- 是否真的省下時間
- 是否減少重工
- 是否留下可檢查的草稿
- 是否避免錯誤動作直接發出
- 是否能被一般使用者理解

## 6. 可直接用的 prompt
你是產品設計顧問，請把下面這個 AI 功能拆成可落地的 workflow。

請輸出：
1. 這功能真正改變了哪個工作流
2. 它需要哪些資料與權限
3. 它可以做哪些動作，哪些要人工確認
4. 它最可能失敗在哪裡
5. 這功能怎麼設計才不會增加 cleanup
6. 如果要做成 MVP，先砍掉哪些部分

功能描述：
[在這裡貼上你的功能說明]

## 7. 我自己的判斷句
- 如果它只是回答問題，不算 agent
- 如果它會做事但邊界不清，不算可上線
- 如果它不能省時間，只是在搬運工作，不值得吹

這份模板是我根據 Google I/O 這種發表會整理出來的，不是原文照抄。原始來源是 Wirecutter 的回顧文章，以及 Google I/O 官方頁面。我把它轉成比較適合開發者直接拿去寫 prompt、PRD 或內部筆記的版本。

如果你要回頭看原始內容，先讀來源，再拿這份模板去拆你自己的產品。這樣比較不會只記得新聞標題，卻忘了真正該抄的是工作流。

// 相關文章

Google I/O 把 Search 變代理人

Search 不再只是輸入框，這件事很重要

訂閱 AI 趨勢週報

Google 終於把 agent 講得像能做雜事了

智慧眼鏡這次終於不像玩具了

命名亂成一團，不是小事

真正的標準很無聊：有沒有幫我省時間

可抄的模板

Windows 裝 Docker Desktop 先搞定 WSL

Grok 4.5 登上 Cursor，$2/$6 開賣

AGT 把代理呼叫變受管動作

OpenClaw v2026.7.1 把控制台變工作區

OpenAI 無螢幕喇叭把 ChatGPT 變陪伴

SCALE 讓 CUDA 變可攜 GPU 編譯