Não há um fosso de inferência Não tem havido desde 2023 com a compilação de modelos a partir do torch 2.0 e a consolidação para transformers do DiT A Nvidia perde o mercado de inferência a longo prazo em lotes para um TCO mais baixo (AMD) e em tempo real (TPU, ASICS)