Myślę, że Sutton ma rację w zasadzie we wszystkim Naśladowanie u zwierząt nie jest naśladowaniem. To cel naśladowania, a *czynności motoryczne* są uczone bez żadnych danych. Szpak nie może naśladować czynności motorycznych, nie widzi ich. To cel naśladowania
Bardzo trudno jest sprawić, by ludzie to zrozumieli A tak przy okazji, nie mów, że LLM-y używają RL Nie używają RL w swoim życiu To jest w drodze, a dalsze postępy tylko potwierdzają jego tezę.
LLM-y są złe, jeśli chodzi o gorzką lekcję, ponieważ są w zasadzie przeciwieństwem mnożników obliczeniowych. Staram się pomóc wam to zrozumieć.
@bftnad jakby, wciąż musi zrozumieć, nauczyć się, zbadać, jak wydawać rzeczywiste polecenia silnika
116,19K