$NVDA y $AMD rendimiento de tokens por GPU frente a la latencia de extremo a extremo (FP8). Esto es brutal. Fuente: SemiAnalysis.