Je pense que Sutton a raison à peu près sur tout L'imitation chez les animaux n'est pas de l'imitation. C'est un objectif d'imiter, et les *actions motrices* sont apprises sans aucune donnée. Le étourneau ne peut pas imiter les actions motrices, il ne les voit pas. C'est un objectif d'imiter
Il est très difficile de faire comprendre cela aux gens Et au fait, ne dites pas que les LLM utilisent le RL Ils n'utilisent pas le RL dans leur vie C'est en route, et aller plus loin ne fait que prouver que son avis est plus juste
Les LLMs sont mauvais au fait, en termes de leçon amère, car ils sont essentiellement l'opposé des multiplicateurs de calcul. J'essaie de vous aider à comprendre.
@bftnad comme, il doit encore comprendre, apprendre, explorer comment donner les commandes réelles au moteur
116,19K