Nové upozornění na benchmark! LiveMCPBench vyzývá agenty LLM, aby se orientovali ve složitosti nástrojů protokolu MCP (Model Context Protocol) Testuje scénáře z reálného světa s 95 úkoly, 70 servery MCP a 527 nástroji!
81,38K