Nouvelle alerte de référence ! LiveMCPBench défie les agents LLM de naviguer dans les complexités des outils du Protocole de Contexte de Modèle (MCP) Tests de scénarios réels avec 95 tâches, 70 serveurs MCP et 527 outils !
81,36K