新しいベンチマークアラート! LiveMCPBench は、モデル コンテキスト プロトコル (MCP) ツールの複雑さをナビゲートするために LLM エージェントに挑戦します 95 のタスク、70 の MCP サーバー、および 527 のツールを使用して、実際のシナリオをテストします。
81.37K