عند تدريب نماذج الأساس متعدد الوسائط ، أستمتع دائما بالعودة إلى أول وكيل عام أصدرته @scott_e_reed و @NandoDF وفريقه في DeepMind ، والذي تم إصداره قبل chatGPT في مايو من عام 2022. نموذج 1.2B ، Gato ، ليس فقط متعدد الوسائط ، ولكنه سياسة عامة متعددة المهام ومتعددة التجسيد. "يمكنه تشغيل Atari ، وصور التسمية التوضيحية ، والدردشة ، وكتل المكدس بذراع روبوت حقيقي وأكثر من ذلك بكثير ، ويقرر بناء على سياقه ما إذا كان سيتم إخراج النص أو عزم الدوران المشترك أو الضغط على الأزرار أو الرموز المميزة الأخرى." غرد ناندو "انتهت اللعبة" بعد هذا الإصدار!