5 個今天就能跑的免費 AI 模型
5 個免費 AI 選項涵蓋雲端 API、模型比對、離線本機與程式碼模型,適合先試再決定要不要付費。

這篇整理 5 個今天就能直接使用的免費 AI 選項,幫你判斷要選雲端 API、模型比對平台、離線本機工具,還是程式碼模型。
如果你想先試再付費,這份清單可以直接幫你縮小選擇。它整理了 5 個仍可用的免費方案,從 1M token 上下文、免費試用額度,到本機零成本推理,讓你先決定要不要走雲端、混合式,還是完全離線。
| 項目 | 免費門檻 | 規格亮點 | 適合情境 |
|---|---|---|---|
| Google AI Studio | 免費帳號可用 | Gemini 免費存取、配額寬鬆 | 快速原型與聊天應用 |
| OpenRouter | 可用免費篩選 | 500+ 模型聚合 | 跨供應商測試與比較 |
| Ollama | 本機免費 | 本地推理、免 API key | 離線與隱私工作流 |
| Qwen 3.6-35B-A3B | 開源權重可部署 | 3B active params、長上下文 | 高效率程式碼任務 |
| GitHub Models | GitHub 用戶免費層 | Playground + API | 開發者測試與提示詞驗證 |
1. Google AI Studio
訂閱 AI 趨勢週報
每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。
不會寄垃圾信,隨時可取消。
Google AI Studio 是最容易上手的免費雲端入口。你不用自己架環境,就能直接碰到 Gemini 模型,適合先把想法做成可跑的 API 或聊天原型。

它的重點不是花俏功能,而是啟動速度。從註冊到第一個請求通常很快,對要驗證產品概念、做 demo、或先測提示詞的人來說很省時間。
- 免費存取 Gemini 模型
- 適合快速原型與聊天應用
- 可直接做 API 測試
2. OpenRouter
OpenRouter 比較像模型轉接台。它把多家供應商的模型放在同一個介面裡,還能用免費篩選找出不花錢的選項,適合想橫向比較輸出的人。
如果你常遇到某一家配額卡住,或想先看不同模型對同一段 prompt 的反應,這個平台會比單一供應商更實用。
- 聚合 500+ 模型
- 可用免費篩選找方案
- 適合跨模型比較與測試
3. Ollama
Ollama 是本機推理最直接的選擇。它主打在自己的電腦上跑模型,不需要 API key,也沒有每次呼叫都計費的壓力,macOS、Linux、Windows 都能用。

對重視隱私、離線操作,或想把資料留在裝置上的人來說,這類工具的價值很明確。你可以把它當成本機 AI 沙盒,先驗證流程再考慮雲端部署。
- 一條指令即可下載與啟動模型
- 內建本機 API server
- 適合離線與私密工作流
4. Qwen 3.6-35B-A3B
Qwen 3.6-35B-A3B 是這份名單裡最值得注意的程式碼模型之一。它是 MoE 架構,只有 3B active parameters,代表它比同級大模型更省資源,但仍保留長上下文與推理能力。
如果你的重點是程式碼補全、repo 級推理、長上下文除錯,這種效率型模型比單純追求參數量更有意義。它也有 Apache 2.0 授權,對團隊導入更友善。
可用情境:
- code completion
- repo-wide reasoning
- long-context debugging
- agentic coding experiments5. GitHub Models
GitHub Models 最適合已經在 GitHub 裡工作的開發者。它提供免費層,能直接試 GPT-4o、Llama 3.3、Mistral 等模型,還有 Playground 和 API 方便快速驗證。
它的優勢是工作流整合。你可以在同一個帳號裡測提示詞、比對模型表現,然後再回到 repo、issue 和 code review,不必切換太多平台。
- GitHub 用戶可用免費層
- 同時有 Playground 與 API
- 適合團隊內部測試與提示詞調整
怎麼挑
如果你要的是最快開始,先選 Google AI Studio。若你的目的是比較不同模型,OpenRouter 更像測試場。重視隱私和離線,Ollama 會是最穩的本機方案。
做程式碼工作時,Qwen 3.6-35B-A3B 比較偏效率與長上下文;如果你本來就用 GitHub 開發,GitHub Models 會是最順手的免費入口。