EmbeddingGemma, un modello di embedding multilingue compatto con 308M di parametri, perfetto per applicazioni RAG su dispositivo - e lo abbiamo reso super facile da integrare con LlamaIndex! 🛠️ Integrazione pronta all'uso con la classe Embedding di LlamaIndex di @huggingface - basta specificare i prompt per la query e il documento Il modello ottiene punteggi eccellenti nel Massive Text Embedding Benchmark pur essendo abbastanza piccolo per i dispositivi mobili. Inoltre, è facilmente adattabile - il blog mostra come l'adattamento su dati medici abbia creato un modello che supera alternative molto più grandi. Ci piace vedere modelli efficienti come questo che rendono potenti embedding accessibili ovunque, specialmente per le distribuzioni edge dove ogni MB conta. Guarda il profondo approfondimento tecnico completo e gli esempi di integrazione: