Novo alerta de referência! O LiveMCPBench desafia agentes LLM a navegar pelas complexidades das ferramentas do Protocolo de Contexto de Modelo (MCP) Testes de cenários do mundo real com 95 tarefas, 70 servidores MCP e 527 ferramentas!
81,36K