Novo alerta de benchmark! O LiveMCPBench desafia os agentes do LLM a navegar pelas complexidades das ferramentas do Model Context Protocol (MCP) Testa cenários do mundo real com 95 tarefas, 70 servidores MCP e 527 ferramentas!
81,36K