Sono davvero entusiasta di condividere il nostro ultimo lavoro su AgentSynth: Un nuovo paradigma per generare attività e benchmark realistici, scalabili e a lungo termine per l'uso del computer! La nostra pipeline automatizzata genera un set di dati di 6.000+ attività con due vantaggi rivoluzionari: Notevole risparmio 💰 sui costi: AgentSynth produce attività a soli $ 0,60 per traiettoria, ordini di grandezza in meno rispetto alla tradizionale annotazione umana. Complessità 🧗 ad alta fedeltà: queste attività rispecchiano le sfide a lungo termine del mondo reale, spesso richiedendo agli agenti di coordinarsi su più applicazioni come Chrome, VS Code e LibreOffice per avere successo.
Xuandong Zhao
Xuandong Zhao18 giu 2025
🚀 Excited to share our latest work: AgentSynth A powerful and cost-effective pipeline for generating diverse, high-quality, and realistic computer-use tasks Details below 🧵(1/n)
Un enorme ringraziamento ai collaboratori @Jingxu97, Dylan Xu e @xuandongzhao. 📷 📷
6,4K