"veRL é o melhor framework de RL, é super eficiente" sério. você tem certeza disso? você tem certeza de que precisa de 16 GPUs para ajustar um modelo de 7B com contexto de 8k? você acha razoável que cada passo leve 19 minutos para isso?