Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
.@RichardSSutton, батько навчання з підкріпленням, не вважає, що LLM – це гіркі уроки.
Моя сталева людина з позицією Річарда: нам потрібна нова архітектура, яка забезпечить безперервне (на робочому місці) навчання.
І якщо у нас є постійне навчання, нам не потрібна спеціальна фаза навчання - агент просто вчиться на льоту - як всі люди, і навіть як всі тварини.
Ця нова парадигма зробить наш нинішній підхід до LLM застарілим.
Я зробив усе можливе, щоб представити думку, що LLM функціонуватимуть як основа, на якій може відбуватися це експериментальне навчання. Полетіли якісь іскри.
0:00:00 – LLM – це глухий кут?
0:13:51 – Чи займаються люди імітацією?
0:23:57 – Ера досвіду
0:34:25 – Поточні архітектури погано узагальнюють поза розподілом
0:42:17 – Сюрпризи у сфері штучного інтелекту
0:47:28 – Чи буде «Гіркий урок» застосовуватися після AGI?
0:54:35 – Спадкоємство до ШІ
Шукайте подкаст Dwarkesh на YouTube, Apple Podcasts, Spotify тощо, щоб дивитися там і підписуватися на майбутні епізоди.
464,76K
Найкращі
Рейтинг
Вибране