"veRL est le meilleur cadre RL, il est super efficace" Vraiment. Es-tu sûr de ça ? Es-tu sûr qu'il te faut 16 GPU pour ajuster un modèle de 7B avec un contexte de 8k ? Penses-tu que c'est raisonnable que chaque étape prenne 19 minutes pour cela ?