Kiedy trenuję multimodalne modele podstawowe omni, zawsze cieszę się, że mogę wrócić do pierwszego agenta ogólnego wydanego przez @scott_e_reed, @NandoDF i zespół w DeepMind, wydanego przed chatGPT w maju 2022 roku. Model 1,2B, Gato, jest nie tylko multimodalny, ale także wielozadaniowy i wielokorpusowy ogólny polityk. „Może grać w Atari, opisywać obrazy, czatować, układać klocki za pomocą prawdziwego ramienia robota i wiele więcej, decydując na podstawie swojego kontekstu, czy wyjść tekst, momenty obrotowe, naciśnięcia przycisków czy inne tokeny.” Nando napisał na Twitterze „Koniec gry” po tym wydaniu!