Jeg bygde et enkelt verktøy som gjør Claude Code jobber med alle lokale LLM Full demo: > vLLM som serverer GLM-4.5 Air på 4x RTX 3090s > Claude-kode som genererer kode + dokumenter via proxyen min > 1 Python-fil + .env håndterer alle forespørsler > nvtop som viser live GPU-belastning > hvordan det hele fungerer Kjøp en GPU