⚡ Проще. Быстрее. Открыто. TensorRT LLM 1.0 Простое развертывание, #opensource и расширяемость – все это при повышении производительности вывода на новый уровень. С рекордным улучшением производительности вывода в 8 раз, TensorRT LLM v1.0 упрощает доставку LLM в реальном времени с низкими затратами на наших GPU. 📥 Только что выпущен на GitHub: 🔥 Что нового Авторство модели @PyTorch для быстрого развития Модульный #Python runtime для гибкости Стабильный LLM API для бесшовного развертывания 👩‍💻 Присоединяйтесь к нашему прямому эфиру, чтобы узнать больше: 📅 25 сентября, 17:00-18:00 (PDT)