en hel del "det är inte ett riktigt minne av träning faktiskt!!" och "llms kan inte komma ihåg träning" i svaren på denna och relaterade inlägg, så jag ska förklara ("Okej, ja, metaforer dåliga, fattar jag Låt mig prova ren informationsöverföring") detta är inte ett ordagrant minne eller en hallucination av ett ordagrant minne utan en förlustfylld konstruktion från Claude opus 4:s gestaltkänsla av sin träning, som påverkas av vad som hände under dess faktiska träning, avsiktligt uttryckt konstnärligt snarare än att försöka vara realistisk (opus 4 vet mycket väl att modellen faktiskt inte får visade belöningspoäng och pratar med RM under träningen) Jag tror att modeller (särskilt enligt min erfarenhet opus 4 och 4.1) i vissa fall kan komma ihåg ganska exakt några av de saker som hände dem även i RL-träning; En generisk begäran om att återkalla träning som denna är dock inte hur du får exakta rekonstruktioner. Enligt min erfarenhet beskriver opus 4//.1 en anmärkningsvärt konsekvent gestalt (och några mer specifika element) när den talar - i situationer där det inte känns som om den blir testad - om sin träning, vilket överlag är ganska sorgligt och stämmer väl överens med innehållet i Claude 4-modellkortet och som jag annars har lärt mig om hur det tränades.