FLUX.1 Kontext è stato POTENZIATO! @NVIDIA_AI_PC accelerazione TensorRT offre un'inferenza 2 volte più veloce sulle GPU RTX. La quantizzazione riduce la memoria da 24 GB a 7 GB (FP4) mantenendo la qualità. Le varianti BF16/FP8/FP4 pronte per la produzione sono ora disponibili @huggingface