Realmente animado para compartilhar nosso trabalho mais recente no AgentSynth: Um novo paradigma para gerar tarefas e benchmarks realistas, escaláveis e de longo prazo para o uso de computadores! Nosso pipeline automatizado gera um conjunto de dados de 6.000+ tarefas com duas vantagens revolucionárias: Economia de custos 💰 dramática: o AgentSynth produz tarefas a apenas US$ 0,60 por trajetória — ordens de magnitude mais baratas do que a anotação humana tradicional. Complexidade 🧗 de alta fidelidade: essas tarefas espelham desafios reais de longo prazo, muitas vezes exigindo que os agentes coordenem vários aplicativos, como Chrome, VS Code e LibreOffice, para serem bem-sucedidos.
Xuandong Zhao
Xuandong Zhao18/06/2025
🚀 Excited to share our latest work: AgentSynth A powerful and cost-effective pipeline for generating diverse, high-quality, and realistic computer-use tasks Details below 🧵(1/n)
Muito obrigado aos colaboradores @Jingxu97, Dylan Xu e @xuandongzhao. 📷 📷
6,4K