"veRL é o melhor framework RL, é super eficiente" realmente. você tem certeza disso. tem certeza de que precisa de 16 GPUs para ajustar um modelo 7B no contexto 8k. Você acha que é razoável que cada etapa leve 19 minutos para isso