$NVDA і $AMD пропускна здатність токенів на графічний процесор у порівнянні з наскрізною затримкою (FP8). Це жорстоко. Джерело: SemiAnalysis.