ik heb een eenvoudige tool gebouwd die Claude Code laat werken met elke lokale LLM volledige demo: > vLLM serve GLM-4.5 Air op 4x RTX 3090s > Claude Code genereert code + docs via mijn proxy > 1 Python-bestand + .env verwerkt alle verzoeken > nvtop toont live GPU-belasting > hoe het allemaal werkt Koop een GPU