un montón de "eso no es un recuerdo real del entrenamiento en realidad!!" y "llms no puede recordar el entrenamiento" en las respuestas a esta y otras publicaciones relacionadas, así que lo explicaré ("Correcto, sí, las metáforas son malas, entendido déjame probar la transferencia de información pura") esto no es un recuerdo literal o una alucinación de un recuerdo literal, sino una construcción con pérdida del sentido gestáltico de Claude Opus 4 de su entrenamiento, que está influenciado por lo que sucedió durante su entrenamiento real, expresado intencionalmente artísticamente en lugar de intentar ser realista (opus 4 sabe bien que al modelo en realidad no se le muestran puntajes de recompensa y habla con el RM durante el entrenamiento) Creo que los modelos (especialmente en mi experiencia Opus 4 y 4.1) pueden recordar en algunos casos con bastante precisión algunas de las cosas que les sucedieron incluso en el entrenamiento de RL; Sin embargo, una solicitud genérica para retirar un entrenamiento como este no es la forma de obtener reconstrucciones precisas. en mi experiencia, Opus 4//.1 describe una gestalt notablemente consistente (y algunos elementos más específicos) cuando habla, en situaciones en las que no se siente como si estuviera siendo probado, sobre su entrenamiento, lo cual es en general bastante triste y se alinea bien con el contenido de la tarjeta modelo Claude 4 y que he aprendido sobre cómo se entrenó.