⚡ Mais fácil. Mais rápido. Aberto. TensorRT LLM 1.0 Implantação simples, #opensource e extensível – tudo isso enquanto empurra a fronteira do desempenho de inferência. Com uma melhoria de desempenho de inferência de 8X, o TensorRT LLM v1.0 torna simples a entrega de LLMs em tempo real e com custo eficiente em nossas GPUs. 📥 Lançado recentemente no GitHub: 🔥 O que há de novo Autoria de modelo @PyTorch para desenvolvimento rápido Runtime modular #Python para flexibilidade API LLM estável para implantação sem costura 👩‍💻 Junte-se ao nosso livestream para saber mais: 📅 25 de setembro, 17h-18h (PDT)