Магазин DApp | Центр Web3 для подій та ігор

Актуальні теми

Ми навчили гуманоїда з 22-DoF, вправними руками, збирати моделі автомобілів, керувати шприцами, сортувати покерні карти, складати/скручувати футболки — усе це навчилося переважно з 20 000+ годин егоцентричного людського відео без робота в процесі. Люди — це наймасштабованіше втілення на планеті. Ми виявили майже ідеальний лог-лінійний закон масштабування (R² = 0,998) між об'ємом людського відео та втратами при прогнозуванні дії, і ця втрата безпосередньо передбачає успішність реальних роботів. Гуманоїдні роботи стануть кінцевою метою, адже вони є практичним форм-фактором з мінімальним розривом у втіленні від людей. Назвімо це гірким уроком апаратного забезпечення: кінематична схожість дозволяє нам просто перенаправляти рух пальців людини на спритні суглоби роботизованої руки. Жодних навчених вкладень, жодних складних алгоритмів передачі. Відносний рух зап'ястя + перенацілені дії пальців 22-DoF слугують єдиним простором дій, що переходить від попереднього тренування до виконання робота. Наш рецепт називається «EgoScale»: - Попереднє навчання GR00T N1.5 на 20 тисячах годин людського відео, посеред поїзда з лише 4 годинами (!) даних робота з руками Sharpa. 54% приріст порівняно з навчанням з нуля у п'яти дуже спритних завданнях. - Найдивовижніший результат: *одна* демонстрація телеопу достатня, щоб вивчити раніше не бачене завдання. Наш рецепт забезпечує надзвичайну ефективність даних. - Хоча ми попередньо навчаємося у просторі суглобів рук 22-DoF, політика переноситься на Unitree G1 з трипальцями 7-DoF. 30%+ приріст порівняно з тренуванням лише на основі даних G1. Масштабований шлях до спритності роботів ніколи не був роботами. Завжди були ми. Детальний аналіз у темі:

Найкращі

Рейтинг

Вибране