Saya belum mendengarkan hal itu, tetapi meniru token keluaran jelas sangat berbeda meniru proses internal yang menghasilkannya. Saya pikir itu adalah kritik yang buruk bahkan jika Sutton secara luas benar bahkan mengesampingkannya, kita melakukan RL komputasi tinggi sekarang?