Při trénování multimodálních modelů všesměrových základů se vždy rád vracím k prvnímu obecnému agentovi, který vydal @scott_e_reed, @NandoDF a tým v DeepMind a který byl vydán před chatGPT v květnu 2022. Model 1.2B, Gato, je nejen multimodální, ale také multitaskingová a multi-ztělesněná všeobecná politika. "Může přehrávat Atari, popisovat obrázky, chatovat, skládat bloky se skutečným robotickým ramenem a mnoho dalšího, přičemž se na základě svého kontextu rozhoduje, zda vypíše text, společné momenty, stisky tlačítek nebo jiné tokeny." Nando po tomto vydání tweetoval "Game over"!