Il n'y a pas de fossé d'inférence Cela n'a pas été le cas depuis 2023 avec la compilation de modèles à partir de torch 2.0 et la consolidation vers des transformateurs de DiT Nvidia perd le marché de l'inférence à long terme sur le lot pour un TCO plus bas (AMD) et en temps réel (TPU, ASICS)