he construido una herramienta simple que hace que Claude Code funcione con cualquier LLM local demo completa: > vLLM sirviendo GLM-4.5 Air en 4x RTX 3090s > Claude Code generando código + docs a través de mi proxy > 1 archivo Python + .env maneja todas las solicitudes > nvtop mostrando la carga de GPU en vivo > cómo funciona todo Compra una GPU