Nytt benchmark-varsel! LiveMCPBench utfordrer LLM-agenter til å navigere i kompleksiteten til Model Context Protocol (MCP)-verktøy Tester virkelige scenarier med 95 oppgaver, 70 MCP-servere og 527 verktøy!
81,37K