EmbeddingGemma, kompaktowy model wielojęzyczny o 308M parametrach, idealny do aplikacji RAG na urządzeniach - a my sprawiliśmy, że integracja z LlamaIndex jest super prosta!
🛠️ Gotowa do użycia integracja z klasą Embedding @huggingface LlamaIndex - wystarczy określić zapytanie i podpowiedzi dokumentów.
Model osiąga najwyższe miejsca w Massive Text Embedding Benchmark, a jednocześnie jest wystarczająco mały, aby działać na urządzeniach mobilnych. Dodatkowo, łatwo go dostosować - blog pokazuje, jak dostosowanie na danych medycznych stworzyło model, który przewyższa znacznie większe alternatywy.
Cieszymy się, widząc efektywne modele takie jak ten, które sprawiają, że potężne osadzenia są dostępne wszędzie, szczególnie w przypadku wdrożeń brzegowych, gdzie każdy MB ma znaczenie.
Zobacz pełne techniczne zagłębienie i przykłady integracji:
📄 Parsowanie vs. Ekstrakcja: Dwa podstawowe podejścia do przetwarzania dokumentów
Budujesz agentów dokumentów? Wiedza, kiedy parsować, a kiedy ekstraktować, jest kluczowa dla prawidłowego zaprojektowania architektury.
W tym dogłębnym przeglądzie @tuanacelik omawia:
🔍 Parsowanie - Konwersja nieustrukturyzowanych dokumentów na ustrukturyzowany markdown przy zachowaniu układu, tabel i formatowania. Idealne dla aplikacji, w których potrzebujesz pełnego kontekstu dokumentu.
⚙️ Ekstrakcja - Wykorzystanie LLM do wyciągania konkretnych pól i encji z walidacją schematu. Idealne do wydobywania konkretnych informacji do zadań downstream.
Przeczytaj pełny przewodnik techniczny 👉