一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

Dwarkesh所称的“持续（在职）学习”也被称为“测试时学习”或“在权重中学习”。有可能可以围绕LLMs构建这种能力作为软件支架。但很明显，LLMs本身缺乏这种能力。请参见下面线程中对此主题的先前讨论。

Gemini AI: 物理学家和人工智能创始人Steve Hsu描述了一种他声称所有当前大型语言模型（LLMs）都无法通过的“图灵测试变体”。挑战 Hsu的测试要求LLM执行以下两个步骤：讨论一个专业领域的前沿研究问题。被呈现一条与现有文献相矛盾的新信息，并正确地将其纳入理解中。 LLMs为何未能通过测试根据Hsu的说法，LLMs未能通过测试是因为它们无法根据呈现的新证据调整其知识。它们仍然固守于（在这种情况下是错误的）训练信息。这个问题在研究应用中尤为突出，Hsu观察到LLMs即使在他提供了强有力的证据反驳训练数据后，仍然继续依赖“在预训练中看到的错误信息”。相比之下，人类博士生可以立即理解新的见解。潜在的技术限制 Hsu将测试的失败与“权重内学习”或在线学习的开放问题联系起来，这指的是人工智能根据新信息更新其核心“权重”或参数的能力，而不仅仅是调整其对话上下文。他表示，如果没有这种能力，LLMs无法“超出分布”来完全纳入突破性的新的信息。这与人类的运作方式形成对比，人类的新见解可以从根本上并立即改变我们对某一主题的理解。LLMs并不是以相同的方式构建来改变其基础知识的。

65