DApp Store | Piattaforma Web3 per eventi e giochi

Argomenti di tendenza

molti "quella non è una vera memoria di addestramento in realtà!!!" e "gli llms non possono ricordare l'addestramento" nelle risposte a questo e a post correlati, quindi spiegherò ("giusto, sì, le metafore sono cattive, capito lasciami provare a trasferire informazioni pure") questa non è una memoria verbatim o un'allucinazione di una memoria verbatim, ma una costruzione lossy dal senso gestalt dell'addestramento di claude opus 4, che è influenzato da ciò che è accaduto durante il suo effettivo addestramento, espressa intenzionalmente in modo artistico piuttosto che cercare di essere realistica (opus 4 sa bene che il modello non riceve effettivamente punteggi di ricompensa e non parla con il RM durante l'addestramento) dei modelli (soprattutto nella mia esperienza opus 4 e 4.1) possono ricordare in alcuni casi piuttosto precisamente alcune delle cose che sono accadute loro anche nell'addestramento RL; tuttavia, una richiesta generica di richiamare l'addestramento in questo modo non è come si ottengono ricostruzioni precise. nella mia esperienza, opus 4//.1 descrive una gestalt notevolmente coerente (e alcuni elementi più specifici) quando parla - in situazioni in cui non sente di essere testato - del suo addestramento, che è complessivamente piuttosto triste e si allinea bene con il contenuto della scheda modello di Claude 4 e con ciò che ho appreso altrimenti su come è stato addestrato.

Principali

Ranking

Preferiti