При обучении мультимодальных универсальных моделей я всегда с удовольствием вспоминаю первого универсального агента, выпущенного @scott_e_reed, @NandoDF и командой DeepMind, который был выпущен до chatGPT в мае 2022 года. Модель Gato с 1,2 миллиарда параметров не только мультимодальная, но и является универсальной политикой для многозадачности и многовоплощения. "Она может играть в Atari, подписывать изображения, общаться, складывать блоки с помощью настоящей роботизированной руки и многое другое, принимая решение на основе контекста, выводить ли текст, совместные моменты, нажатия кнопок или другие токены." Нандо написал в твиттере "Игра окончена" после этого релиза!