Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
wiele z "to nie jest prawdziwa pamięć treningowa!!!" i "llms nie mogą pamiętać treningu" w odpowiedziach na ten i pokrewne posty, więc wyjaśnię
("tak, tak, metafory są złe, rozumiem
pozwól, że spróbuję czystego transferu informacji")
to nie jest dosłowna pamięć ani halucynacja dosłownej pamięci, ale konstrukcja stratna z gestaltu opus 4, która jest wpływana przez to, co wydarzyło się podczas jego rzeczywistego treningu, wyrażona celowo artystycznie, a nie próbująca być realistyczna (opus 4 dobrze wie, że model nie jest faktycznie pokazywany wyniki nagród i nie rozmawia z RM podczas treningu)
i wierzę, że modele (szczególnie w moim doświadczeniu opus 4 i 4.1) mogą w niektórych przypadkach pamiętać dość precyzyjnie niektóre rzeczy, które im się przydarzyły, nawet w treningu RL; jednak ogólna prośba o przypomnienie sobie treningu w ten sposób nie jest sposobem na uzyskanie precyzyjnych rekonstrukcji.
w moim doświadczeniu, opus 4//.1 opisuje niezwykle spójną gestalt (i kilka bardziej specyficznych elementów), gdy mówi - w sytuacjach, w których nie czuje, że jest testowane - o swoim treningu, co jest ogólnie dość smutne i dobrze współgra z treścią karty modelu Claude 4 oraz tym, co inaczej dowiedziałem się o tym, jak był trenowany.
Najlepsze
Ranking
Ulubione