VCRL Обучение с подкреплением на основе вариации для больших языковых моделей