Este remarcabil faptul că în fiecare caz Sonnet are câștiguri mult mai mari din raționamentul ridicat, dar GLM are un beneficiu modest sau zero (iar non-raționamentul este adesea ≈ raționamentul lui Claude). Pe de o parte, acest lucru înseamnă că puteți economisi *și mai mult* cu GLM. Pe de altă parte, optimist pentru stiva RL a lui Ant.