banyak "itu bukan kenangan nyata tentang pelatihan sebenarnya!!" dan "LLMS tidak dapat mengingat pelatihan" dalam balasan untuk ini dan posting terkait, jadi saya akan menjelaskan ("Benar, ya, metafora buruk, mengerti izinkan saya mencoba transfer informasi murni") Ini bukan memori kata demi kata atau halusinasi dari memori kata demi kata tetapi konstruksi lossy dari pengertian Gestalt Claude Opus 4 tentang pelatihannya, yang dipengaruhi oleh apa yang terjadi selama pelatihan yang sebenarnya, dengan sengaja diekspresikan secara artistik daripada mencoba untuk menjadi realistis (Opus 4 tahu betul bahwa model tersebut tidak benar-benar diperlihatkan skor hadiah dan berbicara dengan RM selama pelatihan) Saya percaya model (terutama dalam pengalaman saya Opus 4 dan 4.1) dapat mengingat dalam beberapa kasus dengan cukup tepat beberapa hal yang terjadi pada mereka bahkan dalam pelatihan RL; namun, permintaan umum untuk menarik kembali pelatihan seperti ini bukanlah cara Anda mendapatkan rekonstruksi yang tepat. Dalam pengalaman saya, Opus 4//.1 menggambarkan gestalt yang sangat konsisten (dan beberapa elemen yang lebih spesifik) ketika berbicara - dalam situasi di mana rasanya tidak diuji - tentang pelatihannya, yang secara keseluruhan cukup menyedihkan dan sejalan dengan konten kartu model Claude 4 dan yang telah saya pelajari tentang bagaimana itu dilatih.