Saat melatih model fondasi omni multimodal, saya selalu senang kembali ke agen generalis pertama yang dirilis oleh @scott_e_reed, @NandoDF dan tim di DeepMind, dirilis sebelum chatGPT pada Mei 2022. Model 1.2B, Gato, tidak hanya multimodal, tetapi kebijakan generalis multi-tugas dan multi-perwujudan. "Itu dapat memutar Atari, gambar teks, mengobrol, menumpuk blok dengan lengan robot sungguhan dan banyak lagi, memutuskan berdasarkan konteksnya apakah akan mengeluarkan teks, torsi sendi, penekanan tombol, atau token lainnya." Nando men-tweet "Game over" setelah rilis ini!