$NVDA e $AMD Token Throughput per GPU vs. Latenza end-to-end (FP8). Questo è brutale. Fonte: SemiAnalysis.