⚡ 更简单。更快速。更开放。TensorRT LLM 1.0 简单的部署,#opensource,且可扩展——同时推动推理性能的前沿。 凭借创纪录的8倍推理性能提升,TensorRT LLM v1.0 使得在我们的GPU上交付实时、成本高效的LLM变得简单。 📥 刚刚在GitHub上发布: 🔥 新特性 @PyTorch 模型创作,快速开发 模块化的 #Python 运行时,灵活性 稳定的LLM API,便于无缝部署 👩‍💻 加入我们的直播以了解更多: 📅 9月25日,下午5-6点(太平洋夏令时间)