EmbeddingGemma, un modèle d'embedding multilingue compact de 308 millions de paramètres, parfait pour les applications RAG sur appareil - et nous avons rendu l'intégration super facile avec LlamaIndex ! 🛠️ Intégration prête à l'emploi avec la classe Embedding de LlamaIndex @huggingface - il suffit de spécifier les requêtes et les invites de documents. Le modèle obtient des classements élevés sur le Massive Text Embedding Benchmark tout en étant suffisamment petit pour les appareils mobiles. De plus, il est facilement ajustable - le blog montre comment l'ajustement sur des données médicales a créé un modèle qui surpasse des alternatives beaucoup plus grandes. Nous adorons voir des modèles efficaces comme celui-ci qui rendent les embeddings puissants accessibles partout, en particulier pour les déploiements en périphérie où chaque Mo compte. Voir l'analyse technique complète et des exemples d'intégration :