⚡ Dễ dàng hơn. Nhanh hơn. Mở. TensorRT LLM 1.0 Triển khai đơn giản, #opensource, và có thể mở rộng – tất cả trong khi đẩy mạnh ranh giới của hiệu suất suy diễn. Với cải tiến hiệu suất suy diễn kỷ lục 8X, TensorRT LLM v1.0 giúp việc cung cấp LLM thời gian thực, tiết kiệm chi phí trên các GPU của chúng tôi trở nên đơn giản. 📥 Vừa mới phát hành trên GitHub: 🔥 Những gì mới @PyTorch tác giả mô hình cho phát triển nhanh chóng Thời gian chạy #Python mô-đun cho tính linh hoạt API LLM ổn định cho việc triển khai liền mạch 👩‍💻 Tham gia buổi livestream của chúng tôi để tìm hiểu thêm: 📅 25 tháng 9, 5-6 giờ chiều (PDT)