Google DeepMind 對外開放 Co-Scientist
Google DeepMind 將 Gemini 多代理系統 Co-Scientist 開放給研究者,主打假說生成、排序與驗證,已在 Nature 發表並進入試用。

Google DeepMind 將 Co-Scientist 開放給研究者,這是一套用 Gemini 做假說生成與排序的多代理系統。
說真的,這東西很像研究版的組隊外掛。Google DeepMind 把它從內部研究,拉到實驗工具階段。它要幫科學家先想出假說,再挑出值得做的方向。
這次不是空口說白話。團隊把成果發在 Nature。也開了 labs.google/science 給研究者登記。還提到已經在抗藥性與肝纖維化等題目上試跑。
| 項目 | 內容 |
|---|---|
| 發表期刊 | Nature |
| 對外開放時間 | 未來幾週 |
| 研究者模式 | Hypothesis Generation 實驗工具 |
| 合作單位 | Daiichi Sankyo、Bayer Crop Science、US National Laboratories |
| 實驗結果 | 91% 阻斷纖維化相關反應 |
它到底在解什麼問題
訂閱 AI 趨勢週報
每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。
不會寄垃圾信,隨時可取消。
很多研究卡住,不是因為資料不夠。是因為假說太多。你有論文、資料庫、實驗紀錄,還是很難決定下一步要先測哪個方向。

Google DeepMind 把 Co-Scientist 放在這個痛點上。它不是只做摘要。它要幫研究者縮小搜尋範圍,先把可能的解法排出來。
這個定位其實很合理。很多 AI 工具都在做預測。可是在研究現場,真正麻煩的是選題。你先選錯題,後面全白忙。
Co-Scientist 建在 Gemini 上。它不是單一模型硬上。它是多代理架構。每個 agent 分工不同,像一個小型研究委員會。
- 生成 agent 先提出初始假說。
- 反思 agent 會挑毛病。
- 演化 agent 會重寫與合併想法。
- 主管 agent 負責拆解任務與協調流程。
多代理怎麼運作
講白了,Co-Scientist 比較像辯論賽,不像聊天機器人。它先丟出一堆方向,再互相打架。最後留下比較像樣的假說。
這種設計有一個好處。它把「想法生成」和「想法審查」拆開。這很像人類研究團隊的工作方式,只是速度更快,範圍更大。
DeepMind 說,系統可以探索上千個研究方向。這數字很有感。因為科學研究常常不是缺答案,是缺搜尋能力。
“Co-Scientist feels like a collaborator that’s read everything available about biomedical science, with the reasoning capabilities to find the connections that we’re currently missing.” — Professor Gary Peltz, Stanford University School of Medicine
它也不是只會吐文字。DeepMind 說它會用網路搜尋,還會接資料庫,像 ChEMBL、UniProt,必要時還能搭配 AlphaFold。這才像真的在做研究,不是只會寫報告。
先看數字,再看實際差別
這次最有料的地方,是它不是只有概念。DeepMind 丟出了幾個很具體的數字。這些數字不算多,但夠讓人判斷它是不是只是 demo。

其中最醒目的,是 91% 這個結果。還有把分析時間從 months 壓到 days。這種差距,對研究團隊來說很現實,因為它直接影響能不能多做幾輪實驗。
我整理成表格,會比較好看。
| 指標 | 數值 | 意義 |
|---|---|---|
| 期刊 | Nature | 代表研究有正式學術背書 |
| 開放時程 | 未來幾週 | 不是紙上談兵,已進入試用流程 |
| 纖維化反應阻斷率 | 91% | 代表候選方向有實驗價值 |
| 分析時間 | months → days | 直接縮短研究前期作業 |
| 合作單位 | 3 類 | 包含藥廠、農業與國家級實驗室 |
這裡還有一個很實際的訊號。它不是只在單一學科試水溫。合作名單橫跨藥物、農業、國家實驗室。這代表 DeepMind 想測的不是某個 niche,而是整個研究工作流。
- 肝纖維化案例出現 91% 阻斷率。
- 一個團隊把分析時間從幾個月壓到幾天。
- 系統被形容成像 50 個人工作一天。
- 合作範圍涵蓋 Daiichi Sankyo、Bayer Crop Science、US National Laboratories。
這和其他 AI 研究工具差在哪
現在很多 AI 研究工具,還停在摘要與檢索。你問它問題,它幫你整理資料。這很方便,但還不夠。
Co-Scientist 想做的是假說層。也就是說,它要幫你決定下一步要測什麼。這個層級更接近研究決策,而不是文件處理。
如果拿競品來看,差異就更清楚。像傳統文獻搜尋工具,重點是找資料。像一般 LLM,重點是生成文字。Co-Scientist 則是把生成、批判、排序串起來。
這也解釋了為什麼它敢談多代理。單一模型容易發散。多代理至少能把「想法」和「審查」分開,降低一頭熱亂猜的機率。
- 傳統搜尋工具:擅長找論文。
- 一般 LLM:擅長寫摘要。
- Co-Scientist:擅長產生與篩選假說。
- AlphaFold:擅長蛋白質結構預測,但不是完整研究流程。
不過也別太神化它。這類工具再強,最後還是要回到實驗。AI 可以幫你縮小範圍,不能替你洗試管。
這波對研究圈的意義
我覺得這次比較重要的,不是 Co-Scientist 這個名字,而是工作流正在變。以前研究者靠文獻、會議、經驗。現在多了一層 AI 先篩選。
這種改變最先發生的地方,很可能是生醫。因為生醫資料多,成本高,失敗也貴。只要能少走幾個死胡同,就有價值。
後面可能會擴到材料科學、化學、甚至農業研發。因為這些領域都有同樣問題:候選太多,測試太慢,研究者時間太少。
這也會逼平台廠商往前走。誰能接更多高品質資料,誰能把檢索、推理、驗證串得更順,誰就比較有機會進研究室的日常流程。
如果你是做 AI 工具或資料平台的開發者,這裡其實很值得注意。未來競爭點,不只是模型大小。還有資料接得好不好,和人類審查流程接得順不順。
接下來我會看什麼
接下來最該觀察的,是研究者到底會不會真的用。Demo 很容易吸睛,日常使用才知道有沒有料。
我會盯三件事。第一,輸出的假說有多常能進實驗。第二,研究者要花多少時間校正結果。第三,它能不能在不同領域複製。
如果你問我判斷標準,我會很直接。只要它能讓一個團隊少做 20% 的無效搜尋,就算很有價值。要是能把幾個月縮成幾天,那就不是玩具了。
所以問題很簡單。你會把它當成研究助手,還是只當成另一個會講話的 LLM?我覺得答案會決定這類工具接下來的市場位置。