"veRL er det beste RL-rammeverket, det er supereffektivt" virkelig. Er du sikker på det. er du sikker på at du trenger 16 GPUer for å stille inn en 7B-modell i 8k-kontekst. Synes du det er rimelig at hvert trinn tar 19 minutter for dette