Am construit un instrument simplu care face Claude Code lucrează cu orice LLM local Demonstrație completă: > vLLM care deservește GLM-4.5 Air pe 4x RTX 3090 > Claude Code generarea codului + documente prin intermediul proxy-ului meu > 1 fișier Python + .env gestionează toate cererile > nvtop afișează încărcarea GPU live > cum funcționează totul Cumpărați un GPU