FLUX.1 Kontext 增压了! @NVIDIA_AI_PC TensorRT 加速可在 RTX GPU 上将推理速度提高 2 倍。 量化将内存从 24GB 减少到 7GB (FP4),同时保持质量。 生产就绪的 BF16/FP8/FP4 变体现已@huggingface