来自苹果的一篇引人入胜的论文。 MoEs 比你想象的更强:使用 RoE 的超并行推理扩展 论文: