لا يعتقد .@RichardSSutton ، والد التعلم المعزز ، أن LLMs عبارة عن حبوب منع الحمل المريرة. رجل الصلب الخاص بي في موقف ريتشارد: نحن بحاجة إلى بعض الهندسة المعمارية الجديدة لتمكين التعلم المستمر (أثناء العمل). وإذا كان لدينا تعلم مستمر ، فلن نحتاج إلى مرحلة تدريب خاصة - يتعلم الوكيل فقط أثناء التنقل - مثل جميع البشر ، وفي الواقع ، مثل جميع. سيجعل هذا النموذج الجديد نهجنا الحالي مع LLMs عفا عليه الزمن. لقد بذلت قصارى جهدي لتمثيل وجهة النظر القائلة بأن ماجستير القانون ستعمل كأساس يمكن أن يحدث عليه هذا التعلم التجريبي. طارت بعض الشرر. 0:00:00 - هل LLMs طريق مسدود؟ 0:13:51 - هل يقوم البشر بالتعلم المقلد؟ 0:23:57 - عصر التجربة 0:34:25 - تعميم البنى الحالية بشكل سيئ خارج التوزيع 0:42:17 - مفاجآت في مجال الذكاء الاصطناعي 0:47:28 - هل سيظل الدرس المر ساريا بعد الذكاء الاصطناعي العام؟ 0:54:35 - الخلافة على الذكاء الاصطناعي
ابحث عن Dwarkesh Podcast على YouTube و Apple Podcasts و Spotify وما إلى ذلك لمشاهدتها هناك والاشتراك في الحلقات المستقبلية.
‏‎685.12‏K