Очень рады поделиться с вами нашей последней работой над AgentSynth: Новая парадигма для создания реалистичных, масштабируемых и долгосрочных задач и тестов для использования на компьютере! Наш автоматизированный конвейер генерирует набор данных из 6 000+ задач с двумя революционными преимуществами: Значительная экономия 💰 средств: AgentSynth выполняет задачи всего по 0,60 доллара за траекторию, что на порядки дешевле, чем традиционное аннотирование человеком. Высокая точность сложности 🧗: Эти задачи отражают реальные долгосрочные проблемы, часто требующие от операторов координации действий в нескольких приложениях, таких как Chrome, VS Code и LibreOffice, чтобы добиться успеха.
Xuandong Zhao
Xuandong Zhao18 июн. 2025 г.
🚀 Excited to share our latest work: AgentSynth A powerful and cost-effective pipeline for generating diverse, high-quality, and realistic computer-use tasks Details below 🧵(1/n)
Огромное спасибо соавторам @Jingxu97, Дилан Сюй и @xuandongzhao. 📷 📷
6,41K