Naprawdę cieszymy się, że możemy podzielić się naszą najnowszą pracą nad AgentSynth: Nowy paradygmat generowania realistycznych, skalowalnych i długoterminowych zadań i testów porównawczych dla użytkowników komputerowych! Nasz zautomatyzowany potok generuje zestaw danych 6 000+ zadań z dwiema przełomowymi zaletami: Radykalna oszczędność 💰 kosztów: AgentSynth tworzy zadania za jedyne 0,60 USD za trajektorię - o rzędy wielkości tańsze niż tradycyjna adnotacja ludzka. Złożoność 🧗 o wysokiej wierności : Zadania te odzwierciedlają rzeczywiste wyzwania długoterminowe, często wymagające od agentów koordynacji w wielu aplikacjach, takich jak Chrome, VS Code i LibreOffice, aby odnieść sukces.
Xuandong Zhao
Xuandong Zhao18 cze 2025
🚀 Excited to share our latest work: AgentSynth A powerful and cost-effective pipeline for generating diverse, high-quality, and realistic computer-use tasks Details below 🧵(1/n)
Ogromne podziękowania dla współpracowników @Jingxu97, Dylana Xu i @xuandongzhao. 📷 📷
6,39K