FLUX.1 Kontext a été SURALIMENTÉ ! @NVIDIA_AI_PC accélération TensorRT offre une inférence 2 fois plus rapide sur les GPU RTX. La quantification réduit la mémoire de 24 Go à 7 Go (FP4) tout en maintenant la qualité. Les variantes BF16/FP8/FP4 prêtes pour la production sont maintenant disponibles @huggingface