$NVDA e $AMD taxa de transferência de token por GPU vs. latência de ponta a ponta (FP8). Isso é brutal. Fonte: SemiAnálise.