Tutaj, rubryka RL przyznawała 48 punktów, ale Opus wiedział, że odpowiedź to 24. To okno na to, jak modele doświadczają RL