$NVDA och $AMD tokendataflöde per GPU jämfört med svarstid från slutpunkt till slutpunkt (FP8). Detta är brutalt. Källa: SemiAnalysis.