Nowe powiadomienie o benchmarku! LiveMCPBench wyzywa agentów LLM do nawigacji w złożoności narzędzi Model Context Protocol (MCP) Testuje scenariusze z rzeczywistego świata z 95 zadaniami, 70 serwerami MCP i 527 narzędziami!
81,37K