標籤
DeepSeek-R1
DeepSeek-R1 是以推理能力為核心的開源大型語言模型,常被拿來和 Qwen、GLM、Llama 等模型比較。這個主題聚焦 benchmark、授權、自架部署與伺服器推論效能,對評估開源模型是否能進入實際生產很重要。
4 篇文章

技術研究/6月29日
Prompt injection 已是 AI 資安問題
Prompt injection 會用隱藏文字操控 LLM。近期測試顯示,像 DeepSeek-R1 這類模型,仍可能在注入攻擊下失手。

技術研究/6月11日
2026 年開源 LLM 已經在多數核心工作上超越 GPT-4 級模型
2026 年,開源 LLM 已不再只是備案;在推理、寫程式與長上下文任務上,它們已經成為比 GPT-4 級模型更值得優先採用的選擇。

模型發布/4月2日
2026 開源 LLM 誰領先
Qwen 3.5、GLM-5、DeepSeek R1、Llama 4 讓開源 LLM 進入實戰。這篇整理 2026 年主流模型的 benchmark、上下文長度、授權條款與自架表現。

產業動態/4月2日
NVIDIA 再刷 MLPerf 推論紀錄
NVIDIA 在 MLPerf Inference v6.0 再交出新成績,GB300 NVL72 對 DeepSeek-R1 伺服器推論提升 2.7x,Llama 3.1 405B 也提升 1.5x。