EmbeddingGemma, en kompakt flerspråkig inbäddningsmodell med 308 M-parametrar, perfekt för RAG-applikationer på enheten - och vi har gjort det superenkelt att integrera med LlamaIndex!
🛠️ Färdig att använda integration med LlamaIndex's @huggingface Embedding-klass - ange bara frågan och dokumentprompterna
Modellen uppnår topplaceringar på Massive Text Embedding Benchmark samtidigt som den är tillräckligt liten för mobila enheter. Dessutom är det lätt att finjustera - bloggen visar hur finjustering av medicinska data skapade en modell som överträffar mycket större alternativ.
Vi älskar att se effektiva modeller som denna som gör kraftfulla inbäddningar tillgängliga överallt, särskilt för gränsdistributioner där varje MB räknas.
Se de fullständiga exemplen på teknisk djupdykning och integrering:
📄 Tolkning vs. extrahering: Två grundläggande metoder för dokumentbearbetning
Bygga dokumentagenter? Att veta när du ska parsa jämfört med när du ska extrahera är grundläggande för att få din arkitektur rätt.
I denna djupdykning bryter @tuanacelik ner:
🔍 Tolkning – Konvertera ostrukturerade dokument till strukturerad markdown samtidigt som layout, tabeller och formatering bevaras. Perfekt för program där du behöver fullständig dokumentkontext.
⚙️ Extrahering – Använda LLM:er för att hämta specifika fält och entiteter med schemavalidering. Perfekt för att extrahera specifik information för underordnade uppgifter.
Läs hela den tekniska guiden 👉