一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动 | OKX Wallet

发现功能使用指南

background background

discoveryBanners

热门话题

#

Bonk 生态迷因币展现强韧势头

#

有消息称 Pump.fun 计划 40 亿估值发币，引发市场猜测

LAUNCHCOIN+24.14%

#

Solana 新代币发射平台 Boop.Fun 风头正劲

header

steve hsu

物理学家、AI 创始人、Manifold 播客

steve hsu

steve hsu19 小时前

“想象训练”是指代理的策略完全在学习到的世界模型内部（即在“想象”中）进行优化的过程，而无需进一步与真实环境互动。对于真实机器人，工厂环境的视频（包括动作及其效果）将用于构建一个现实的世界模型，然后利用想象训练来开发机器人行为规则（策略）。 “我们介绍了Dreamer 4，一个可扩展的代理，通过在快速且准确的世界模型内部进行强化学习来学习解决复杂的控制任务。该代理由一个分词器和一个动态模型组成，如图2所示。分词器将视频帧压缩为连续表示，动态模型则根据交错的动作预测这些表示，二者均使用相同的高效变换器架构。分词器使用掩码自编码进行训练，动态模型则使用快捷强制目标进行训练，以便在少量前向传递中实现交互生成，并防止随时间累积错误。如算法1所述，我们首先在视频和动作上预训练分词器和世界模型，然后通过交错任务嵌入微调策略和奖励模型到世界模型中，最后通过想象训练对策略进行后训练。

2.49K

steve hsu

steve hsu10月1日 09:07

战争是地狱 - 在距离莫斯科豪华公寓1000公里外操作攻击无人机。但他可能很快就会失去工作，变成机器人😉

4.97K

steve hsu

steve hsu10月1日 07:29

好主意。利用AI和众包输入来修正维基百科的文章。构建高门槛的AI验证器，以审核对现有维基的每个提议修改。

Elon Musk

Elon Musk2025年9月30日

我们正在构建 Grokipedia @xAI。这将是对维基百科的重大改进。坦率地说，这是实现 xAI 理解宇宙目标的必要步骤。

4.98K

热门

排行

收藏

©2017 - 2025 WEB3.OKX.COM

简体中文繁體中文 English Tiếng Việt Русский Español (Latinoamérica)Bahasa Indonesia Français Deutsch Italiano Polski Čeština Română Português (Portugal)Português (Brasil)Українська Español (España)Nederlands العربية 日本語 Norsk (bokmål)Suomi Svenska

关于 OKX Wallet

下载学院关于我们就业机会联系我们服务条款隐私政策 X (原推特)

产品

行情币币兑换市场赚币发现开发者中心浏览器安全

用户支持

帮助中心官方渠道验证公告 DEX 费率标准加入 OKX 社群比特币钱包以太坊钱包 Solana 钱包