L'algoritmo X dovrebbe essere RL'd con la sua ricompensa che è la scala di Kardashev