FLUX.1 上下文获得了超级加速! @NVIDIA_AI_PC TensorRT 加速在 RTX GPU 上实现了 2 倍更快的推理。 量化将内存从 24GB 削减到 7GB(FP4),同时保持质量。 现已在 @huggingface 上提供生产就绪的 BF16/FP8/FP4 变体。
NVIDIA AI PC
NVIDIA AI PC2025年7月2日
📸 生成。精炼。重复。 @bfl_ml 的 FLUX.1 Kontext 通过文本 + 图像提示简化了 AI 图像编辑——现在使用 TensorRT 加速的 RTX。 额外信息:谷歌的新 Gemma 3n 多模态 LLM 也在 RTX 上加速。 🔗 #RTXAIGarage:
36.74K