新的基准警报! LiveMCPBench 挑战 LLM 代理应对模型上下文协议 (MCP) 工具的复杂性 测试现实世界场景,包含 95 个任务、70 个 MCP 服务器和 527 个工具!
81.38K