標籤
Hugging Face
Hugging Face 是開源 AI 模型與工具的核心分發平台,從模型權重、資料集到推理與部署都在這裡形成生態。它的下載量、社群協作與模型榜單,常直接反映生成式 AI、agent 與開源模型競爭的走向。
15 篇文章

用 vLLM 部署 MiniMax M3 並開啟 OpenAI API
這篇教你用 vLLM 在本機或伺服器部署 MiniMax M3,並開出相容 OpenAI 的 API 端點。

PEFT LoRA 微調 LLM 實作指南
這篇教你用 PEFT 和 LoRA 只訓練小型 adapter,完成 LLM 微調、保存與部署。

NVIDIA 的 Hugging Face 5 類模型最適合誰
5 類 NVIDIA Hugging Face 模型覆蓋推理、語音、視覺、RAG 與物理 AI,適合快速判斷該從哪條 AI 管線開始。

情緒辨識 SLM 微調實作指南
用 ISMOTE、LoRA 和 focal loss,把開放權重小語言模型微調成多標籤情緒辨識器。

MLX Community 讓 Mac 模型直接跑
我拆 MLX Community 怎麼把 Apple Silicon 的模型權重先轉好,讓你直接用 mlx-lm、mlx-vlm、mlx-audio 跑起來。

Unsloth 把 Kimi-K2.5 做成 GGUF 包
Unsloth 在 Hugging Face 釋出 Kimi-K2.5 的 GGUF 量化包,包含 4-bit 與 5-bit 版本,方便本地端推理與不同硬體配置測試。

怎麼在本機跑 Gemma 4
用 Unsloth Studio 或 llama.cpp 在本機下載、啟動並聊天 Gemma 4。

怎麼做 LLM 微調
學會用 SFT、LoRA、RLHF 或 DPO 微調大型語言模型,建立可訓練、可對齊、可部署的完整流程。

怎麼用 Unsloth 跑與微調 LLM
這篇教你用 Unsloth 先完成本機 LLM 載入,再做 LoRA 微調與最小可行訓練驗證。

llama.cpp 把本地推理做進 C/C++
llama.cpp 強調在 C/C++ 中做本地 LLM 推理,支援多種硬體與 OpenAI 相容伺服器,適合離線、邊緣與隱私場景。

如何為企業微調 LLM
這篇教你用 LoRA 或 QLoRA 為企業任務微調 LLM,從定義任務、整理資料到訓練與評估都能照步驟完成。

2026年4月值得追的開源 AI 專案
2026 年 4 月的開源 AI 很熱鬧。GitHub 的 agent 工具、Hugging Face 的模型下載數都很猛,這篇整理最值得看的專案、數據和實際影響。

agents-radar 每天抓 10 個 AI 訊號
agents-radar 用 GitHub Actions 每天 08:00 CST 抓 10 個 AI 來源,產出中英雙語摘要,還能透過 MCP 查詢歷史報告。

ChatGPT 廣告越來越一致
40,000 筆廣告版位分析顯示,ChatGPT 廣告正變得更短、更直白、更標準化。這反映 OpenAI 在優化轉換,也透露 LLM 使用習慣正在往任務導向收斂。

Cursor、Kimi 與開源賭注
Cursor 把 Composer 2 建在 Moonshot AI 的 Kimi K2.5 上,價格約只有傳統方案的八分之一。這篇拆解它的成本邏輯、開源模型競爭、資安風險,還有台灣開發者該怎麼看。