.@RichardSSutton, bapak pembelajaran penguatan, tidak berpikir LLM adalah pil pelajaran pahit.
Pria baja saya dari posisi Richard: kita membutuhkan beberapa arsitektur baru untuk memungkinkan pembelajaran berkelanjutan (di tempat kerja).
Dan jika kita memiliki pembelajaran berkelanjutan, kita tidak memerlukan fase pelatihan khusus - agen hanya belajar dengan cepat - seperti semua manusia, dan memang, seperti semua hewan.
Paradigma baru ini akan membuat pendekatan kita saat ini dengan LLM menjadi usang.
Saya melakukan yang terbaik untuk mewakili pandangan bahwa LLM akan berfungsi sebagai dasar di mana pembelajaran berdasarkan pengalaman ini dapat terjadi. Beberapa percikan api beterbangan.
0:00:00 – Apakah LLM jalan buntu?
0:13:51 – Apakah manusia melakukan pembelajaran tiruan?
0:23:57 – Era Pengalaman
0:34:25 – Arsitektur saat ini digeneralisasi dengan buruk di luar distribusi
0:42:17 – Kejutan di bidang AI
0:47:28 – Akankah The Bitter Lesson masih berlaku setelah AGI?
0:54:35 – Suksesi AI
.@RichardSSutton, bapak pembelajaran penguatan, tidak berpikir LLM adalah pil pelajaran pahit.
Pria baja saya dari posisi Richard: kita membutuhkan beberapa arsitektur baru untuk memungkinkan pembelajaran berkelanjutan (di tempat kerja).
Dan jika kita memiliki pembelajaran berkelanjutan, kita tidak memerlukan fase pelatihan khusus - agen hanya belajar dengan cepat - seperti semua manusia, dan memang, seperti semua hewan.
Paradigma baru ini akan membuat pendekatan kita saat ini dengan LLM menjadi usang.
Saya melakukan yang terbaik untuk mewakili pandangan bahwa LLM akan berfungsi sebagai dasar di mana pembelajaran berdasarkan pengalaman ini dapat terjadi. Beberapa percikan api beterbangan.
0:00:00 – Apakah LLM jalan buntu?
0:13:51 – Apakah manusia melakukan pembelajaran tiruan?
0:23:57 – Era Pengalaman
0:34:25 – Arsitektur saat ini digeneralisasi dengan buruk di luar distribusi
0:42:17 – Kejutan di bidang AI
0:47:28 – Akankah The Bitter Lesson masih berlaku setelah AGI?
0:54:35 – Suksesi AI