標籤

DeepSeek-R1

DeepSeek-R1 是以推理能力為核心的開源大型語言模型，常被拿來和 Qwen、GLM、Llama 等模型比較。這個主題聚焦 benchmark、授權、自架部署與伺服器推論效能，對評估開源模型是否能進入實際生產很重要。

4 篇文章

Prompt injection 已是 AI 資安問題

Prompt injection 會用隱藏文字操控 LLM。近期測試顯示，像 DeepSeek-R1 這類模型，仍可能在注入攻擊下失手。

2026 年，開源 LLM 已不再只是備案；在推理、寫程式與長上下文任務上，它們已經成為比 GPT-4 級模型更值得優先採用的選擇。

Qwen 3.5、GLM-5、DeepSeek R1、Llama 4 讓開源 LLM 進入實戰。這篇整理 2026 年主流模型的 benchmark、上下文長度、授權條款與自架表現。

NVIDIA 在 MLPerf Inference v6.0 再交出新成績，GB300 NVL72 對 DeepSeek-R1 伺服器推論提升 2.7x，Llama 3.1 405B 也提升 1.5x。