Não há fosso de inferência Não tem sido desde 2023 com compilação de modelos da tocha 2.0 e consolidação para transformadores da DiT Nvidia perde mercado de inferência a longo prazo em lote para reduzir TCO (AMD) e tempo real (TPU, ASICS)