開源 LLM 的參考 C++ 推理引擎。Ollama、LM Studio、Jan、KoboldCpp 的基礎層。
Best evidence tier. Signup tested end-to-end by xmr.club curator — deposit + withdrawal + edge cases. No-KYC posture verified at retail volume. Last_verified within 12 months.
完整細則 + 7 步驗證流程見 /methodology.
開源 LLM 的參考 C++ 推理引擎 — Ollama / LM Studio / Jan / KoboldCpp / llamafile 全部封裝的專案,由發明了開源權重生態系統標準化的 GGUF 模型格式的開發者創建。評級為 Grade A,因為 `llama.cpp` 是不可簡化的本地推理層:資料路徑上無運營者、MIT 授權、單一二進位檔安裝、整個過程中零帳號、原生加速支援 CPU + NVIDIA CUDA + AMD ROCm + Apple Metal + Vulkan。本目錄中最強的隱私姿態,與 Ollama(位於上方一個封裝層)並列,並且當您想要對量化、上下文窗口、批次大小和卸載分割的最大控制時的正確答案 — 這些正是 Ollama 所抽象掉的東西。
它是什麼。 `llama.cpp` 是一個單一儲存庫的 C++ 專案(`github.com/ggml-org/llama.cpp`,70k+ 星),載入量化後的 GGUF 模型權重並對其執行 LLM 推理。它提供:
Ollama 是「消費者應用」封裝層,而 `llama.cpp` 是引擎。每個 Ollama 功能(模型服務、提示模板、GPU 卸載、函數呼叫)底層都是 `llama.cpp`。如果您想跳過封裝層 — 擁有自己的模型檔案、按部署控制量化、將函式庫連結到自訂伺服器 — 這就是該專案。
背景。 由 Georgi Gerganov 於 2023 年 3 月啟動,作為將 Meta 的 LLaMA 模型移植到 C++ 的專案,最初針對 Apple Silicon Mac。該專案迅速成為本地執行開源權重 LLM 的事實參考實現 — 到 2024 年中,整個本地 LLM 生態系統(Ollama、LM Studio、KoboldCpp、GPT4All、llamafile、OpenWebUI 的本地後端、vLLM 的 CPU 模式)都已標準化採用 Gerganov 的 GGUF 模型格式和他的量化演算法。
`llama.cpp` 由一個開源集體透過 `ggml-org` GitHub 組織維護(截至 2025 年中約 600 名貢獻者)。Gerganov 還運營 ggml.ai 公司(保加利亞索菲亞),該公司提供商業支援並向上遊貢獻推理引擎改進,但程式碼庫仍保持 MIT 授權和社群治理 — 無 CLA、無版權轉讓、無企業分支。
您信任什麼。
運營規格。
運營者哲學。 Gerganov 明確表示 `llama.cpp` 是為「所有人、所有地方」構建的 — 明確的目標是讓 LLM 推理在用戶擁有的任何硬體上工作,包括手機、微控制器和僅 CPU 的伺服器。該專案對 `IQ1_S`(1.5-bit)和 `Q2_K`(2-bit)量化的一等支援正是此目標的體現:即使是 70B 模型也可以擠進 16 GB 的 RAM 中,代價是部分品質。底層的 GGML 函式庫是一個單獨維護的張量原語,其他專案(whisper.cpp、stable-diffusion.cpp、bark.cpp)都共享它 — Gerganov 正在構建開放推理基礎設施,而非任何一個應用程式。
評級理由。 Grade A 反映了:本目錄中最強的隱私姿態(推理是本機的、資料路徑上無運營者、無帳號、無遙測)、在寬鬆的開源規範下的 MIT 授權(可分支、可審計、無 CLA)、最廣泛的硬體支援(每個常見平台上的每個消費級加速器 + CPU)、整個本地 LLM 生態系統構建在其上的基礎引擎(Ollama、LM Studio、Jan、KoboldCpp、llamafile 都依賴它 — 可信度向上繼承)、具名運營者責任制但無運營者依賴(Gerganov + ggml.ai 已公開身分,但即使其中任何一方消失,執行環境仍可繼續運作)、過去 12 個月內 r/LocalLLaMA / r/MachineLearning / GitHub issues 中無重大事件,以及活躍維護 — 每月多次發行。最後驗證於 2026-05-26。
何時適用:
注意事項:
Free · MIT · single binary · CPU + CUDA + ROCm + Metal + Vulkan
.onion 鏡像 2026-05-26 (<90d) 尚無社群評論。當第一個。
歡迎誠實、中立的回饋。策展人審核後才會顯示。不需 JS。
Silence censorship. Protect your privacy and bypass restrictions with Xeovo VPN. No email required.
Long-running no-KYC aggregator. XMR-friendly, Tor mirror, broad coin support.
Mobile + desktop multi-coin wallet (XMR, BTC, LTC, ETH) with in-app swap + CakePay.
Non-custodial cross-chain swap router with refund-on-refusal AML policy and multi-destination split swaps. No
Two-year-old no-account instant swap — in-house test swap settled in 3 minutes (0–1 conf), Trocador A privacy