¡Construya agentes que realmente puedan realizar tareas del mundo real! Agent Reinforcement Trainer (ART) es un marco para entrenar a agentes de LLM de varios pasos para tareas del mundo real utilizando GRPO. Solo necesitas unas pocas líneas de código. ¡No se necesitan recompensas manuales! ✨ 100% de código abierto.
48.28K