Jag byggde ett enkelt verktyg som gör Claude Code arbeta med vilken lokal LLM som helst Fullständig demo: > vLLM som betjänar GLM-4.5 Air på 4x RTX 3090s > Claude Code genererar kod + dokument via min proxy > 1 Python-fil + .env hanterar alla förfrågningar > nvtop visar live GPU-belastning > hur det hela fungerar Köp en GPU