[TOOLS] 3 分鐘閱讀OraCore 編輯部

Databricks 為模型服務加上 AI Gateway 推論表

Databricks 於 6 月 30 日更新 AWS 文件,為 Model Serving 與 AI agent 加入 AI Gateway 推論表,將請求、回應與追蹤資料寫入 Unity Catalog。

分享 LinkedIn
Databricks 為模型服務加上 AI Gateway 推論表

Databricks 在 6 月 30 日更新文件,為模型服務端點加入 AI Gateway 推論表,會把請求與回應資料寫進 Unity Catalog。

Databricks 於 2026 年 6 月 30 日更新 AWS 文件,說明 Databricks 的 AI Gateway 已可搭配 inference tables 使用,支援的對象包含 Model Serving 與已部署的 AI agent。這項功能會自動蒐集請求、回應、HTTP 狀態碼、執行時間、request ID 與 trace,集中存到 Unity Catalog 的 Delta table。

項目數值
文件更新日期2026 年 6 月 30 日
支援的端點類型5 種
每個部署自動建立的 AI agent 表3 類資料
payload 資料可用時間1 小時內

發生了什麼

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。

不會寄垃圾信,隨時可取消。

這次更新把 inference tables 從單純的記錄機制,提升成 Model Serving 的內建可觀測層。只要啟用,系統就會把進站請求、出站回應、狀態碼、執行時間、request ID 與 traces 寫入 Unity Catalog,讓團隊可以直接查詢,不必再翻分散的日誌。

Databricks 為模型服務加上 AI Gateway 推論表

文件也把範圍擴到 AI agent。對 agent 來說,Databricks 會保存 payload、request 細節與 MLflow Trace logs;如果是透過 mlflow.deploy() 部署,系統還會自動建立 inference tables。支援的端點類型包含:

  • Provisioned throughput
  • Pay-per-token
  • External models
  • Deployed AI agents
  • Custom models

文件同時列出限制:工作區必須有 Unity Catalog、serverless compute,且所在區域要支援 model serving。Databricks 也提醒,端點建立者與修改者都需要 Can Manage 權限,外加 USE CATALOG、USE SCHEMA、CREATE TABLE 等權限;而且系統只會為新表建立 inference table,既有表不支援直接套用。

為什麼重要

開發者來說,這代表模型流量不再只是黑盒子裡的雜訊,而是可以直接查詢、聯集、比對的資料。團隊能把 inference tables 跟 ground truth 標籤接起來,做評估集、找出錯誤樣本、追 drift,甚至直接在 Databricks SQL 或 notebook 裡檢查失敗案例。

Databricks 為模型服務加上 AI Gateway 推論表

對維運與平台團隊,這也讓 agent debugging 更好做。因為表格會帶著 MLflow traces 和 request metadata,團隊可以追慢請求、比對歷史輸入,快速看出延遲或回應品質是從哪一版開始變化。Databricks 另外提到新的 Unity AI Gateway beta,定位是管理 LLM 端點與 coding agents 的企業控制平面,顯示推論、治理與觀測正在往同一套工作流集中。

Databricks 也明講,改動 schema、重新命名或刪除表格,都可能讓 logging 中斷或損壞表格;對 AI agent 而言,舊的 request logs 與 assessment logs 也正被新 payload tables 取代。對團隊來說,問題已不是要不要記錄模型流量,而是要不要從第一天就把這些資料納入 Unity Catalog 管理。