在训练多模态全能基础模型时,我总是喜欢回顾@scott_e_reed、@NandoDF和DeepMind团队在2022年5月发布的第一个通用智能体,这个模型是在chatGPT之前发布的。 这个12亿参数的模型Gato不仅是多模态的,还是一个多任务和多体现的通用策略。 “它可以玩Atari,给图像加标签,聊天,使用真实的机器人手臂堆积积木,还有更多功能,根据上下文决定输出文本、关节扭矩、按钮按压或其他标记。” Nando在这个发布后发推文“游戏结束”!