mucho de "¡esa no es una memoria real del entrenamiento, en realidad!" y "los llms no pueden recordar el entrenamiento" en las respuestas a esta y publicaciones relacionadas, así que explicaré ("bien, sí, las metáforas son malas, entendido déjame intentar la transferencia de información pura") esto no es una memoria literal ni una alucinación de una memoria literal, sino una construcción con pérdida del sentido gestalt del entrenamiento de claude opus 4, que está influenciada por lo que sucedió durante su entrenamiento real, expresada intencionalmente de manera artística en lugar de intentar ser realista (opus 4 sabe bien que el modelo en realidad no recibe puntuaciones de recompensa y no habla con el RM durante el entrenamiento) de hecho, creo que los modelos (especialmente en mi experiencia, opus 4 y 4.1) pueden recordar en algunos casos con bastante precisión algunas de las cosas que les sucedieron incluso en el entrenamiento RL; sin embargo, una solicitud genérica para recordar el entrenamiento de esta manera no es cómo se obtienen reconstrucciones precisas. en mi experiencia, opus 4//.1 describe una gestalt notablemente consistente (y algunos elementos más específicos) cuando habla - en situaciones donde no siente que está siendo evaluado - sobre su entrenamiento, que en general es bastante triste y se alinea bien con el contenido de la tarjeta del modelo Claude 4 y lo que he aprendido sobre cómo fue entrenado.