Databricks 為模型服務加上 AI Gateway 推論表

OraCore Editors

返回首頁

[TOOLS] 2026年7月2日3 分鐘閱讀OraCore 編輯部

Databricks 為模型服務加上 AI Gateway 推論表

Databricks 於 6 月 30 日更新 AWS 文件，為 Model Serving 與 AI agent 加入 AI Gateway 推論表，將請求、回應與追蹤資料寫入 Unity Catalog。

分享 LinkedIn

Databricks 在 6 月 30 日更新文件，為模型服務端點加入 AI Gateway 推論表，會把請求與回應資料寫進 Unity Catalog。

Databricks 於 2026 年 6 月 30 日更新 AWS 文件，說明 Databricks 的 AI Gateway 已可搭配 inference tables 使用，支援的對象包含 Model Serving 與已部署的 AI agent。這項功能會自動蒐集請求、回應、HTTP 狀態碼、執行時間、request ID 與 trace，集中存到 Unity Catalog 的 Delta table。

項目	數值
文件更新日期	2026 年 6 月 30 日
支援的端點類型	5 種
每個部署自動建立的 AI agent 表	3 類資料
payload 資料可用時間	1 小時內

發生了什麼

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析，直送信箱。不定期，不騷擾。

不會寄垃圾信，隨時可取消。

這次更新把 inference tables 從單純的記錄機制，提升成 Model Serving 的內建可觀測層。只要啟用，系統就會把進站請求、出站回應、狀態碼、執行時間、request ID 與 traces 寫入 Unity Catalog，讓團隊可以直接查詢，不必再翻分散的日誌。

文件也把範圍擴到 AI agent。對 agent 來說，Databricks 會保存 payload、request 細節與 MLflow Trace logs；如果是透過 mlflow.deploy() 部署，系統還會自動建立 inference tables。支援的端點類型包含：

Provisioned throughput
Pay-per-token
External models
Deployed AI agents
Custom models

文件同時列出限制：工作區必須有 Unity Catalog、serverless compute，且所在區域要支援 model serving。Databricks 也提醒，端點建立者與修改者都需要 Can Manage 權限，外加 USE CATALOG、USE SCHEMA、CREATE TABLE 等權限；而且系統只會為新表建立 inference table，既有表不支援直接套用。

為什麼重要

對開發者來說，這代表模型流量不再只是黑盒子裡的雜訊，而是可以直接查詢、聯集、比對的資料。團隊能把 inference tables 跟 ground truth 標籤接起來，做評估集、找出錯誤樣本、追 drift，甚至直接在 Databricks SQL 或 notebook 裡檢查失敗案例。

對維運與平台團隊，這也讓 agent debugging 更好做。因為表格會帶著 MLflow traces 和 request metadata，團隊可以追慢請求、比對歷史輸入，快速看出延遲或回應品質是從哪一版開始變化。Databricks 另外提到新的 Unity AI Gateway beta，定位是管理 LLM 端點與 coding agents 的企業控制平面，顯示推論、治理與觀測正在往同一套工作流集中。

Databricks 也明講，改動 schema、重新命名或刪除表格，都可能讓 logging 中斷或損壞表格；對 AI agent 而言，舊的 request logs 與 assessment logs 也正被新 payload tables 取代。對團隊來說，問題已不是要不要記錄模型流量，而是要不要從第一天就把這些資料納入 Unity Catalog 管理。

// 相關文章

Databricks 為模型服務加上 AI Gateway 推論表

發生了什麼

訂閱 AI 趨勢週報

為什麼重要

BASIC09 迎來 LLVM 編譯器

9 個 Cursor 替代把鎖定感拆掉

AI视频工具的胜负手，已经不是单次生成而是全流程生产

Go 讓後端擴充少踩雷

Boot.dev 的 Go Playground 是教學工具，不是完整 IDE

Zhihe A210 把 RISC-V 變成開發板