$NVDA 和 $AMD 每个 GPU 的代币吞吐量与端到端延迟(FP8)。这太残酷了。 来源:SemiAnalysis。