$NVDA e $AMD Taxa de Transferência de Token por GPU vs. Latência de ponta a ponta (FP8). Isto é brutal. Fonte: SemiAnalysis.