هل تشعر بالفضول كيفية كتابة أداء SOTA Blackwell matmul kernels باستخدام MGPU؟ لقد نشرنا للتو برنامجا تعليميا قصيرا خطوة بخطوة: في كل خطوة ، نعرض بالضبط التغييرات (الصغيرة) اللازمة لتحسين النواة والنواة النهائية أقل بقليل من 150 سطرا.