Peringatan tolok ukur baru! LiveMCPBench menantang agen LLM untuk menavigasi kompleksitas alat Model Context Protocol (MCP) Menguji skenario dunia nyata dengan 95 tugas, 70 server MCP, dan 527 alat!
81,38K