Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
.@RichardSSutton, cha đẻ của học tăng cường, không nghĩ rằng LLMs đã bị ảnh hưởng bởi bài học đắng.
Cách hiểu của tôi về quan điểm của Richard: chúng ta cần một kiến trúc mới để cho phép học tập liên tục (trong công việc).
Và nếu chúng ta có học tập liên tục, chúng ta không cần một giai đoạn đào tạo đặc biệt - tác nhân chỉ cần học hỏi ngay lập tức - giống như tất cả con người, và thực sự, giống như tất cả động vật.
Mô hình mới này sẽ làm cho cách tiếp cận hiện tại của chúng ta với LLMs trở nên lỗi thời.
Tôi đã cố gắng hết sức để thể hiện quan điểm rằng LLMs sẽ hoạt động như nền tảng cho việc học tập trải nghiệm này có thể diễn ra. Một số tia lửa đã bay lên.
0:00:00 – LLMs có phải là ngõ cụt không?
0:13:51 – Con người có thực hiện học tập bắt chước không?
0:23:57 – Kỷ nguyên của trải nghiệm
0:34:25 – Các kiến trúc hiện tại tổng quát kém khi ra ngoài phân phối
0:42:17 – Những bất ngờ trong lĩnh vực AI
0:47:28 – Bài học đắng có còn áp dụng sau AGI không?
0:54:35 – Sự kế thừa cho AI
Tìm kiếm Dwarkesh Podcast trên YouTube, Apple Podcasts, Spotify, v.v. để xem ở đó và đăng ký để nhận các tập trong tương lai.
685,13K
Hàng đầu
Thứ hạng
Yêu thích