Google DeepMind 對外開放 Co-Scientist

OraCore Editors

返回首頁

[RSCH] 2026年6月5日6 分鐘閱讀OraCore 編輯部

Google DeepMind 對外開放 Co-Scientist

Google DeepMind 將 Gemini 多代理系統 Co-Scientist 開放給研究者，主打假說生成、排序與驗證，已在 Nature 發表並進入試用。

多代理系統 Google DeepMind Gemini

分享 LinkedIn

Google DeepMind 將 Co-Scientist 開放給研究者，這是一套用 Gemini 做假說生成與排序的多代理系統。

說真的，這東西很像研究版的組隊外掛。Google DeepMind 把它從內部研究，拉到實驗工具階段。它要幫科學家先想出假說，再挑出值得做的方向。

這次不是空口說白話。團隊把成果發在 Nature。也開了 labs.google/science 給研究者登記。還提到已經在抗藥性與肝纖維化等題目上試跑。

項目	內容
發表期刊	Nature
對外開放時間	未來幾週
研究者模式	Hypothesis Generation 實驗工具
合作單位	Daiichi Sankyo、Bayer Crop Science、US National Laboratories
實驗結果	91% 阻斷纖維化相關反應

它到底在解什麼問題

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析，直送信箱。不定期，不騷擾。

不會寄垃圾信，隨時可取消。

很多研究卡住，不是因為資料不夠。是因為假說太多。你有論文、資料庫、實驗紀錄，還是很難決定下一步要先測哪個方向。

Google DeepMind 把 Co-Scientist 放在這個痛點上。它不是只做摘要。它要幫研究者縮小搜尋範圍，先把可能的解法排出來。

這個定位其實很合理。很多 AI 工具都在做預測。可是在研究現場，真正麻煩的是選題。你先選錯題，後面全白忙。

Co-Scientist 建在 Gemini 上。它不是單一模型硬上。它是多代理架構。每個 agent 分工不同，像一個小型研究委員會。

生成 agent 先提出初始假說。
反思 agent 會挑毛病。
演化 agent 會重寫與合併想法。
主管 agent 負責拆解任務與協調流程。

多代理怎麼運作

講白了，Co-Scientist 比較像辯論賽，不像聊天機器人。它先丟出一堆方向，再互相打架。最後留下比較像樣的假說。

這種設計有一個好處。它把「想法生成」和「想法審查」拆開。這很像人類研究團隊的工作方式，只是速度更快，範圍更大。

DeepMind 說，系統可以探索上千個研究方向。這數字很有感。因為科學研究常常不是缺答案，是缺搜尋能力。

“Co-Scientist feels like a collaborator that’s read everything available about biomedical science, with the reasoning capabilities to find the connections that we’re currently missing.” — Professor Gary Peltz, Stanford University School of Medicine

它也不是只會吐文字。DeepMind 說它會用網路搜尋，還會接資料庫，像 ChEMBL、UniProt，必要時還能搭配 AlphaFold。這才像真的在做研究，不是只會寫報告。

先看數字，再看實際差別

這次最有料的地方，是它不是只有概念。DeepMind 丟出了幾個很具體的數字。這些數字不算多，但夠讓人判斷它是不是只是 demo。

其中最醒目的，是 91% 這個結果。還有把分析時間從 months 壓到 days。這種差距，對研究團隊來說很現實，因為它直接影響能不能多做幾輪實驗。

我整理成表格，會比較好看。

指標	數值	意義
期刊	Nature	代表研究有正式學術背書
開放時程	未來幾週	不是紙上談兵，已進入試用流程
纖維化反應阻斷率	91%	代表候選方向有實驗價值
分析時間	months → days	直接縮短研究前期作業
合作單位	3 類	包含藥廠、農業與國家級實驗室

這裡還有一個很實際的訊號。它不是只在單一學科試水溫。合作名單橫跨藥物、農業、國家實驗室。這代表 DeepMind 想測的不是某個 niche，而是整個研究工作流。

肝纖維化案例出現 91% 阻斷率。
一個團隊把分析時間從幾個月壓到幾天。
系統被形容成像 50 個人工作一天。
合作範圍涵蓋 Daiichi Sankyo、Bayer Crop Science、US National Laboratories。

這和其他 AI 研究工具差在哪

現在很多 AI 研究工具，還停在摘要與檢索。你問它問題，它幫你整理資料。這很方便，但還不夠。

Co-Scientist 想做的是假說層。也就是說，它要幫你決定下一步要測什麼。這個層級更接近研究決策，而不是文件處理。

如果拿競品來看，差異就更清楚。像傳統文獻搜尋工具，重點是找資料。像一般 LLM，重點是生成文字。Co-Scientist 則是把生成、批判、排序串起來。

這也解釋了為什麼它敢談多代理。單一模型容易發散。多代理至少能把「想法」和「審查」分開，降低一頭熱亂猜的機率。

傳統搜尋工具：擅長找論文。
一般 LLM：擅長寫摘要。
Co-Scientist：擅長產生與篩選假說。
AlphaFold：擅長蛋白質結構預測，但不是完整研究流程。

不過也別太神化它。這類工具再強，最後還是要回到實驗。AI 可以幫你縮小範圍，不能替你洗試管。

這波對研究圈的意義

我覺得這次比較重要的，不是 Co-Scientist 這個名字，而是工作流正在變。以前研究者靠文獻、會議、經驗。現在多了一層 AI 先篩選。

這種改變最先發生的地方，很可能是生醫。因為生醫資料多，成本高，失敗也貴。只要能少走幾個死胡同，就有價值。

後面可能會擴到材料科學、化學、甚至農業研發。因為這些領域都有同樣問題：候選太多，測試太慢，研究者時間太少。

這也會逼平台廠商往前走。誰能接更多高品質資料，誰能把檢索、推理、驗證串得更順，誰就比較有機會進研究室的日常流程。

如果你是做 AI 工具或資料平台的開發者，這裡其實很值得注意。未來競爭點，不只是模型大小。還有資料接得好不好，和人類審查流程接得順不順。

接下來我會看什麼

接下來最該觀察的，是研究者到底會不會真的用。Demo 很容易吸睛，日常使用才知道有沒有料。

我會盯三件事。第一，輸出的假說有多常能進實驗。第二，研究者要花多少時間校正結果。第三，它能不能在不同領域複製。

如果你問我判斷標準，我會很直接。只要它能讓一個團隊少做 20% 的無效搜尋，就算很有價值。要是能把幾個月縮成幾天，那就不是玩具了。

所以問題很簡單。你會把它當成研究助手，還是只當成另一個會講話的 LLM？我覺得答案會決定這類工具接下來的市場位置。

// 相關文章

Google DeepMind 對外開放 Co-Scientist

它到底在解什麼問題

訂閱 AI 趨勢週報

多代理怎麼運作

先看數字，再看實際差別

這和其他 AI 研究工具差在哪

這波對研究圈的意義

接下來我會看什麼

RAG-17 把 SOD1-ALS 寫成可抄模板

大型語言模型全景整理

用多輪互動測 LLM 記憶

Persona steering 會改變模型能力嗎

LLM 推理瓶頸不在算力

技能層：LLM Agent 下一層