⚡ Mudah. Cepat. Buka. TensorRT LLM 1.0 Penerapan sederhana, #opensource, dan dapat diperluas – semuanya sambil mendorong batas kinerja inferensi. Dengan peningkatan kinerja inferensi 8X yang memecahkan rekor, TensorRT LLM v1.0 memudahkan untuk menghadirkan LLM real-time dan hemat biaya pada GPU kami. 📥 Baru saja dirilis di GitHub: 🔥 Apa yang baru @PyTorch kepenulisan model untuk pengembangan yang cepat Runtime #Python modular untuk fleksibilitas API LLM yang stabil untuk penerapan yang mulus 👩 💻 Bergabunglah dengan streaming langsung kami untuk mempelajari lebih lanjut: 📅 25 September, 5-6 sore (PDT)