Propustnost tokenů $NVDA a $AMD na GPU vs. latence mezi koncovými body (FP8). To je brutální. Zdroj: SemiAnalysis.