分散型アプリ（DApp）ストア｜イベントおよびゲーム用 Web3 ハブ

トレンドトピック

ドワーケシュが「継続的(実地)学習」と呼んでいるものは、「テスト時学習」または「インウェイト」学習としても知られています。この機能を LLM を中心としたソフトウェアの足場として構築できる可能性があります。しかし、LLM 自体にはこの機能が欠けていることは明らかです。以下のスレッドでこのトピックに関する以前の議論を参照してください。

ジェミニAI: 物理学者でAIの創設者であるスティーブ・スー氏は、「チューリングテストの変種」について説明し、現在の大規模言語モデル(LLM)はすべて失敗していると主張している。課題 Hsu のテストでは、LLM が次の 2 つの手順を実行する必要があります。専門分野のフロンティア研究問題について議論する。一般的な文献と矛盾する新しい情報を提示され、それをその理解に正しく組み込んでください。 LLM がテストに不合格になる理由 Hsu 氏によると、LLM は、提示された新しい証拠に基づいて知識を適応させることができないために失敗します。彼らは、トレーニングを受けた(この場合は正しくない)情報に固定されたままです。この問題は研究アプリケーションで特に強調されており、Hsu氏は、トレーニングデータと矛盾する非常に強力な証拠を提供した後でも、LLMが「事前トレーニングで見た間違ったもの」に依存し続けていることを観察しています。対照的に、人間の博士課程の学生は、新しい洞察をすぐに理解できます。根本的な技術的制限 Hsu氏は、テストの失敗を「重み込み」学習、つまりオンライン学習という未解決の問題と結びつけており、これはAIが会話のコンテキストを単に調整するのではなく、新しい情報に基づいてコアの「重み」やパラメータを更新する能力を指します。同氏は、この機能がなければ、LLM は画期的な新しい情報を完全に組み込むために「配布から外れる」ことはできないと述べています。これは、新しい洞察が主題に対する私たちの理解を根本的かつ即座に変える可能性がある人間の行動とは対照的です。LLMは、基礎知識を同じように変えるように構築されているわけではありません。

3.3K

トップ

ランキング

お気に入り