Я не слушал это, но имитировать выходные токены явно очень отличается от имитации внутренних процессов, которые их генерируют. Я думаю, что это плохая критика, даже если Саттон в целом прав. Даже если это оставить в стороне, мы сейчас занимаемся высокопроизводительным RL?