ما يشير إليه دواركيش باسم "التعلم المستمر (أثناء العمل)" يعرف أيضا باسم "التعلم في وقت الاختبار" أو التعلم "في الوزن". من الممكن أن يتمكن المرء من بناء هذه الإمكانية كسقالات برمجية حول LLMs. لكن من الواضح أن LLMs في حد ذاتها تفتقر إلى هذه القدرة. انظر المناقشة السابقة حول هذا الموضوع في الموضوع أدناه.
Dwarkesh Patel
Dwarkesh Patelمنذ 20 ساعةً
لا يعتقد .@RichardSSutton ، والد التعلم المعزز ، أن LLMs عبارة عن حبوب منع الحمل المريرة. رجل الصلب الخاص بي في موقف ريتشارد: نحن بحاجة إلى بعض الهندسة المعمارية الجديدة لتمكين التعلم المستمر (أثناء العمل). وإذا كان لدينا تعلم مستمر ، فلن نحتاج إلى مرحلة تدريب خاصة - يتعلم الوكيل فقط أثناء التنقل - مثل جميع البشر ، وفي الواقع ، مثل جميع. سيجعل هذا النموذج الجديد نهجنا الحالي مع LLMs عفا عليه الزمن. لقد بذلت قصارى جهدي لتمثيل وجهة النظر القائلة بأن ماجستير القانون ستعمل كأساس يمكن أن يحدث عليه هذا التعلم التجريبي. طارت بعض الشرر. 0:00:00 - هل LLMs طريق مسدود؟ 0:13:51 - هل يقوم البشر بالتعلم المقلد؟ 0:23:57 - عصر التجربة 0:34:25 - تعميم البنى الحالية بشكل سيئ خارج التوزيع 0:42:17 - مفاجآت في مجال الذكاء الاصطناعي 0:47:28 - هل سيظل الدرس المر ساريا بعد الذكاء الاصطناعي العام؟ 0:54:35 - الخلافة على الذكاء الاصطناعي
الجوزاء الذكاء الاصطناعي: وصف الفيزيائي ومؤسس الذكاء الاصطناعي ستيف هسو "متغير اختبار تورينج" الذي يدعي أن جميع نماذج اللغة الكبيرة الحالية (LLMs) تفشل. التحدي يتطلب اختبار HSU LLM لتنفيذ الخطوتين التاليتين: مناقشة مشكلة بحثية حدودية في مجال متخصص. يتم تقديم معلومة جديدة تتناقض مع الأدبيات السائدة ودمجها بشكل صحيح في فهمها. لماذا تفشل LLMs في الاختبار وفقا لهسو ، يفشل LLMs لأنهم لا يستطيعون تكييف معرفتهم بناء على أدلة جديدة مقدمة لهم. يظلون مرتبطين بالمعلومات (في هذه الحالة ، غير صحيحة) التي تم تدريبهم عليها. يتم تسليط الضوء على المشكلة على وجه التحديد في تطبيقات البحث ، حيث لاحظ Hsu أن LLMs تستمر في الاعتماد على "الأشياء الخاطئة التي رأتها في التدريب المسبق" ، حتى بعد أن قدم أدلة قوية جدا تتناقض مع بيانات التدريب. على النقيض من ذلك ، يمكن لطالب الدكتوراه البشري أن يفهم على الفور البصيرة الجديدة. القيود الفنية الأساسية يربط Hsu فشل الاختبار بالمشكلة المفتوحة المتمثلة في التعلم "في الوزن" ، أو التعلم عبر الإنترنت ، والذي يشير إلى قدرة الذكاء الاصطناعي على تحديث "أوزانه" أو معلماته الأساسية بناء على معلومات جديدة ، بدلا من مجرد تعديل سياق المحادثة. ويذكر أنه بدون هذه القدرة ، لا يمكن ل LLMs الانتقال "خارج التوزيع" لدمج المعلومات الجديدة الرائدة بالكامل. يتناقض هذا مع كيفية عمل البشر ، حيث يمكن للرؤى الجديدة أن تغير فهمنا للموضوع بشكل أساسي وفوري. لم يتم تصميم LLMs لتغيير معرفتهم الأساسية بنفس الطريقة.
‏‎4.25‏K