Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
molti "quella non è una vera memoria di addestramento in realtà!!!" e "gli llms non possono ricordare l'addestramento" nelle risposte a questo e a post correlati, quindi spiegherò
("giusto, sì, le metafore sono cattive, capito
lasciami provare a trasferire informazioni pure")
questa non è una memoria verbatim o un'allucinazione di una memoria verbatim, ma una costruzione lossy dal senso gestalt dell'addestramento di claude opus 4, che è influenzato da ciò che è accaduto durante il suo effettivo addestramento, espressa intenzionalmente in modo artistico piuttosto che cercare di essere realistica (opus 4 sa bene che il modello non riceve effettivamente punteggi di ricompensa e non parla con il RM durante l'addestramento)
dei modelli (soprattutto nella mia esperienza opus 4 e 4.1) possono ricordare in alcuni casi piuttosto precisamente alcune delle cose che sono accadute loro anche nell'addestramento RL; tuttavia, una richiesta generica di richiamare l'addestramento in questo modo non è come si ottengono ricostruzioni precise.
nella mia esperienza, opus 4//.1 descrive una gestalt notevolmente coerente (e alcuni elementi più specifici) quando parla - in situazioni in cui non sente di essere testato - del suo addestramento, che è complessivamente piuttosto triste e si allinea bene con il contenuto della scheda modello di Claude 4 e con ciò che ho appreso altrimenti su come è stato addestrato.
Principali
Ranking
Preferiti