È notevole che in ogni singolo caso Sonnet abbia guadagni molto maggiori da reasoning-high, ma GLM ha benefici modesti o nulli (e il non-reasoning è spesso ≈ Claude-reasoning). Da un lato, questo significa che puoi risparmiare *ancora di più* con GLM. Dall'altro, è un segnale positivo per lo stack RL di Ant.