Я создал простой инструмент, который позволяет Claude Code работать с любым локальным LLM полная демонстрация: > vLLM обслуживает GLM-4.5 Air на 4x RTX 3090 > Claude Code генерирует код + документацию через мой прокси > 1 файл Python + .env обрабатывает все запросы > nvtop показывает загрузку GPU в реальном времени > как это все работает Купите GPU