Penso che Sutton abbia ragione su praticamente tutto L'imitazione negli animali non è imitazione. È un obiettivo da imitare, e le *azioni motorie* vengono apprese senza alcun dato. Il merlo non può imitare le azioni motorie, non le vede. È un obiettivo da imitare
È molto difficile far capire questo alle persone E tra l'altro non dire che gli LLM stanno usando rl Non stanno usando RL nella loro vita È sulla buona strada, e andare oltre dimostra solo che la sua opinione è più corretta
I LLM sono cattivi, a proposito, in termini della lezione amara, perché sono fondamentalmente l'opposto dei moltiplicatori di calcolo. Sto cercando di aiutarvi a capire.
@bftnad tipo, deve ancora capire, imparare, esplorare come fare i comandi del motore effettivi
85,02K