criei uma ferramenta simples que faz Claude Code funcionar com qualquer LLM local demo completa: > vLLM servindo GLM-4.5 Air em 4x RTX 3090s > Claude Code gerando código + docs via meu proxy > 1 arquivo Python + .env gerencia todas as requisições > nvtop mostrando carga de GPU ao vivo > como tudo funciona Compre uma GPU