Motor de inferencia LLM local en C++ — corre en CPU, Apple Silicon o GPU de consumo.
Free · MIT · C++ · CPU/CUDA/ROCm/Metal
Opciones de inferencia de IA sin atarse a una cuenta de OpenAI / Anthropic. Incluye runtimes locales (Ollama, LM Studio), proxies cloud sin KYC (Venice, NanoGPT, Privatemode) y front-ends open source (Open WebUI, Jan).
última revisión: 2026-05-13
› Herramientas de IA » Runtime local 1Motor de inferencia LLM local en C++ — corre en CPU, Apple Silicon o GPU de consumo.
Free · MIT · C++ · CPU/CUDA/ROCm/Metal
Your ai here? → sponsor a ai slot · or DM the bot. Editorial firewall: grade never moves.