Uusi benchmark-hälytys! LiveMCPBench haastaa LLM-agentit navigoimaan MCP (Model Context Protocol) -työkalujen monimutkaisuudessa Testaa todellisia skenaarioita 95 tehtävällä, 70 MCP-palvelimella ja 527 työkalulla!
81,37K