O algoritmo X deve ser RL'd com a sua recompensa sendo a escala Kardashev