Vraiment ravi de partager notre dernier travail sur AgentSynth : Un nouveau paradigme pour générer des tâches et des benchmarks d’utilisation informatique réalistes, évolutifs et à long terme ! Notre pipeline automatisé génère un ensemble de données de + de 6 000 tâches avec deux avantages révolutionnaires : Économies spectaculaires 💰 : AgentSynth produit des tâches à seulement 0,60 $ par trajectoire, soit des ordres de grandeur moins chers que l’annotation humaine traditionnelle. Complexité 🧗 haute fidélité : ces tâches reflètent les défis réels à long terme, nécessitant souvent que les agents se coordonnent entre plusieurs applications telles que Chrome, VS Code et LibreOffice pour réussir.
Xuandong Zhao
Xuandong Zhao18 juin 2025
🚀 Excited to share our latest work: AgentSynth A powerful and cost-effective pipeline for generating diverse, high-quality, and realistic computer-use tasks Details below 🧵(1/n)
Un grand merci aux collaborateurs @Jingxu97, Dylan Xu et @xuandongzhao. 📷 📷
6,39K