Нове сповіщення про бенчмарки! LiveMCPBench кидає виклик агентам LLM орієнтуватися в складнощах інструментів контекстного протоколу моделі (MCP) Тестує реальні сценарії за допомогою 95 завдань, 70 серверів MCP та 527 інструментів!
81,37K