Det är anmärkningsvärt att Sonnet i varje enskilt fall har mycket större fördelar med att resonera högt, men GLM har blygsamma eller inga fördelar (och icke-resonemang är ofta ≈ Claude-resonemang). Å ena sidan betyder det att du kan spara *ännu mer* med GLM. Å andra sidan, hausse för Ants RL-stack.