Thuật toán X nên được RL hóa với phần thưởng là thang Kardashev