Kun koulutan multimodaalisia omni-perusmalleja, palaan aina mielelläni ensimmäiseen yleisagenttiin, jonka @scott_e_reed, @NandoDF ja DeepMindin tiimi julkaisivat ja joka julkaistiin ennen chatGPT:tä toukokuussa 2022. 1.2B-malli, Gato, ei ole vain multimodaalinen, vaan monitehtäväinen ja moniruumistettu generalistinen politiikka. "Se voi toistaa Ataria, kuvatekstejä kuvia, keskustella, pinota lohkoja oikealla robottikädellä ja paljon muuta ja päättää kontekstinsa perusteella, tuottaako se tekstiä, liitosmomentteja, painikkeiden painalluksia tai muita merkkejä." Nando twiittasi "Game over" tämän julkaisun jälkeen!