FLUX.1 Kontext 增壓了! @NVIDIA_AI_PC TensorRT 加速可在 RTX GPU 上將推理速度提高 2 倍。 量化將記憶體從 24GB 減少到 7GB (FP4),同時保持品質。 量產就緒的 BF16/FP8/FP4 變體現已上市@huggingface