$NVDA 和 $AMD 每個 GPU 的代幣吞吐量與端到端延遲 (FP8)。這真是殘酷。 來源:SemiAnalysis。