Sunt foarte încântat să împărtășesc cea mai recentă lucrare a noastră pe AgentSynth: O nouă paradigmă pentru generarea de sarcini și benchmark-uri realiste, scalabile și pe termen lung de utilizare a computerului! Conducta noastră automată generează un set de date de 6.000+ sarcini cu două avantaje care schimbă jocul: Economii 💰 dramatice de costuri: AgentSynth produce sarcini la doar 0,60 USD pe traiectorie - ordine de mărime mai ieftine decât adnotarea umană tradițională. Complexitate 🧗 de înaltă fidelitate : Aceste sarcini oglindesc provocările reale cu orizont lung, necesitând adesea agenților să se coordoneze între mai multe aplicații precum Chrome, VS Code și LibreOffice pentru a reuși.
Xuandong Zhao
Xuandong Zhao18 iun. 2025
🚀 Excited to share our latest work: AgentSynth A powerful and cost-effective pipeline for generating diverse, high-quality, and realistic computer-use tasks Details below 🧵(1/n)
Mulțumiri imense colaboratorilor @Jingxu97, Dylan Xu și @xuandongzhao. 📷 📷
6,41K