El algoritmo X debe ser RL con su recompensa siendo la escala de Kardashev