Przepustowość tokenów $NVDA i $AMD na GPU w porównaniu do opóźnienia end-to-end (FP8). To jest brutalne. Źródło: SemiAnalysis.