Магазин DApp | Web3-центр мероприятий и игр

Актуальные темы

То, что Дваркеш называет "непрерывным (в процессе работы) обучением", также известно как "обучение во время тестирования" или "обучение в весах". Возможно, что такую способность можно создать как программную опору вокруг LLM. Но очевидно, что сами по себе LLM не обладают этой способностью. Смотрите предыдущее обсуждение на эту тему в потоке ниже.

Gemini AI: Физик и основатель AI Стив Хсу описал "вариант теста Тьюринга", который, по его словам, все текущие большие языковые модели (LLM) не проходят. Задача Тест Хсу требует от LLM выполнения следующих двух шагов: Обсудить передовую исследовательскую проблему в специализированной области. Получить новую информацию, которая противоречит существующей литературе, и правильно интегрировать её в своё понимание. Почему LLM не проходят тест По словам Хсу, LLM не проходят тест, потому что не могут адаптировать свои знания на основе новых представленных им доказательств. Они остаются привязанными к (в данном случае, неправильной) информации, на которой они были обучены. Проблема особенно выделяется в исследовательских приложениях, где Хсу наблюдал, как LLM продолжают полагаться на "неправильные вещи, которые они видели в предобучении", даже после того, как он предоставляет очень сильные доказательства, противоречащие данным обучения. Человек-аспирант, напротив, может сразу же понять новое понимание. Основное техническое ограничение Хсу связывает провал теста с открытой проблемой "обучения в весах" или онлайн-обучения, что относится к способности AI обновлять свои основные "веса" или параметры на основе новой информации, а не просто корректировать свой разговорный контекст. Он утверждает, что без этой возможности LLM не могут выйти "за пределы распределения", чтобы полностью интегрировать революционную новую информацию. Это контрастирует с тем, как действуют люди, где новые идеи могут фундаментально и немедленно изменить наше понимание предмета. LLM не созданы для изменения своих основополагающих знаний таким образом.

3,99K

Топ

Рейтинг

Избранное