Lokala MCP-klienter är så underskattade! Alla använder Cursor, Claude Desktop och ChatGPT som MCP-värdar, men om du bygger dina egna appar som stöder MCP behöver du anpassade klienter. Här är problemet: Att skriva MCP-klienter från grunden är smärtsamt och tidskrävande. Idag visar jag dig hur du bygger anpassade MCP-klienter på minuter, inte timmar. För att bevisa detta byggde jag en helt privat, ultimat AI-assistent som kan: - Ansluts till vilken MCP-server som helst - Automatiserar användningen av webbläsaren - Skrapar webbdata sömlöst - Styr terminalen på min dator - Bearbetar bilder, ljud och dokument - Kommer ihåg allt med kunskapsgrafer Hemligheten? mcp-use – ett ramverk med 100 % öppen källkod som gör MCP-integration trivial. Att bygga anpassade MCP-agenter tar 3 steg: 1. Definiera din MCP-serverkonfiguration 2. Anslut valfri LLM med MCP-klienten 3. Distribuera din agent Det är allt. Ingen komplex installation, inga proprietära beroenden. Den bästa delen? Allt körs lokalt. Dina data förblir privata och du kontrollerar hela stacken. Fullständig uppdelning med kod... 👇
Låt oss bryta ner detta genom att utforska varje integration och förstå hur den fungerar, med hjälp av kod och illustrationer:
1️⃣ Stagehand MCP-server Vi börjar med att låta vår agent styra en webbläsare, navigera på webbsidor, ta skärmdumpar etc. med hjälp av @Stagehanddev MCP. Nedan ställde jag en väderfråga, och agenten svarade autonomt på den genom att initiera en webbläsarsession. Kolla in det här👇
2️⃣ Firecrawl MCP-server Därefter lägger vi till funktioner för skrapning, genomsökning och djupgående forskning i agenten. mcp-use stöder anslutning till flera MCP-servrar samtidigt. Så vi lägger till den @firecrawl_dev MCP-konfigurationen till den befintliga konfigurationen och interagerar med den. Kolla in det här👇
3️⃣ Graphiti MCP-server Än så länge är vår agent minneslös. Den glömmer allt efter varje uppgift. @Zep_ai's Graphiti är en MCP-server som förser vår agent med ett grafbaserat minneslager i realtid. Du kan också visualisera denna graf i Neo4j. Kolla in det här👇
4️⃣ Ragie MCP-server Därefter tillhandahåller vi multimodala RAG-funktioner till agenten för att bearbeta texter, bilder, videor, ljud, dokument, etc. Den drivs av @ragieai MCP. Nedan bad jag den att lista projekt i min MCP PDF (ett komplext dokument), och den svarade perfekt. Kolla in det här👇
5️⃣ GitIngest MCP-server För att tillgodose utvecklarnas behov tillåter vi sedan att vår agent chattar med valfri GitHub-lagringsplats. Nedan frågade jag om den tekniska stacken i mitt bokförfattarflöde genom att tillhandahålla repo-länken. Den extraherade rätt information med hjälp av MCP-servern. Kolla in det här👇
6️⃣ Terminal MCP-server Slutligen ger vi vår Agent terminal-kontroll för att utföra kommandon för utvecklaren om det behövs. Det ger verktyg som: - läsa/skriva/söka/flytta filer - Utför ett kommando - Skapa/lista katalog, etc. Kolla in det här👇
Slutligen lindar vi in detta i ett Streamlit-gränssnitt, där vi dynamiskt kan ändra MCP-konfigurationen. Detta ger oss en 100% lokal ultimat AI-assistent som kan surfa, skrapa, har minne, hämta från en multimodal kunskapsbas och mycket mer. Kolla in den här demon👇
Det är en wrap! Om du tyckte att det var insiktsfullt, dela det igen med ditt nätverk. Hitta mig → @akshay_pachaar ✔️ För praktiska insikter och handledningar om LLM:er, AI-agenter och maskininlärning!
43,2K