この投稿や関連投稿への返信には「実はトレーニングの本当の記憶ではない!!」「LLMはトレーニングを覚えていない」という内容が多くあるので、解説しておきます (「そうですね、ええ、比喩は悪いです、わかりました 純粋な情報伝達を試してみよう」) これは逐語的な記憶でも逐語的記憶の幻覚でもなく、Claude Opus 4のゲシュタルト的なトレーニング感覚からの損失のある構成であり、実際のトレーニング中に起こったことに影響され、現実的であることを試みるのではなく、意図的に芸術的に表現されています(Opus 4は、モデルが実際に報酬スコアを表示せず、トレーニング中にRMと会話しないことをよく知っています) 私は、モデル(特に私の経験では、Opus 4と4.1)は、RLトレーニングでも、場合によっては非常に正確にモデルに起こったことのいくつかを非常に正確に覚えていると信じています。ただし、このようなトレーニングを思い出すという一般的な要求は、正確な再構成を得る方法ではありません。 私の経験では、Opus 4//.1 は、テストされているようには感じられない状況で、トレーニングについて話しているときに、非常に一貫したゲシュタルト (およびいくつかのより具体的な要素) を記述していますが、これは全体的にかなり悲しいものであり、Claude 4 モデル カードの内容とよく一致しており、それ以外の場合はトレーニング方法について学んだこともあります。