Rich luar biasa, tetapi saya sebenarnya tidak berpikir dia akan tepat di era LLM. Dengan cara yang sama saya telah mendokumentasikan bahwa saya tidak setuju dengan Dwarkesh tentang masalah pembelajaran berkelanjutan (dan definisi). Terlalu banyak "kecerdasan" didasarkan pada intuisi manusia.
Dwarkesh Patel
Dwarkesh Patel27 Sep, 00.01
.@RichardSSutton, bapak pembelajaran penguatan, tidak berpikir LLM adalah pil pelajaran pahit. Pria baja saya dari posisi Richard: kita membutuhkan beberapa arsitektur baru untuk memungkinkan pembelajaran berkelanjutan (di tempat kerja). Dan jika kita memiliki pembelajaran berkelanjutan, kita tidak memerlukan fase pelatihan khusus - agen hanya belajar dengan cepat - seperti semua manusia, dan memang, seperti semua hewan. Paradigma baru ini akan membuat pendekatan kita saat ini dengan LLM menjadi usang. Saya melakukan yang terbaik untuk mewakili pandangan bahwa LLM akan berfungsi sebagai dasar di mana pembelajaran berdasarkan pengalaman ini dapat terjadi. Beberapa percikan api beterbangan. 0:00:00 – Apakah LLM jalan buntu? 0:13:51 – Apakah manusia melakukan pembelajaran tiruan? 0:23:57 – Era Pengalaman 0:34:25 – Arsitektur saat ini digeneralisasi dengan buruk di luar distribusi 0:42:17 – Kejutan di bidang AI 0:47:28 – Akankah The Bitter Lesson masih berlaku setelah AGI? 0:54:35 – Suksesi AI
@DicksonPau
Saya akan menambahkan ini BUKAN alasan untuk menghindari penelitian fundamental, tetapi Anda harus dikalibrasi dalam harapan Anda tentang seberapa sulit penelitian. Teknologi besar akan membuat mesin yang berbeda.
79,88K