VCRL Apprendimento per rinforzo basato sulla varianza per modelli di linguaggio di grandi dimensioni