EmbeddingGemma, um modelo de embedding multilíngue compacto com 308M de parâmetros, perfeito para aplicações RAG em dispositivos - e tornámos super fácil a integração com o LlamaIndex! 🛠️ Integração pronta para usar com a classe de Embedding do LlamaIndex da @huggingface - basta especificar os prompts de consulta e documento O modelo alcança as melhores classificações no Massive Text Embedding Benchmark, enquanto é pequeno o suficiente para dispositivos móveis. Além disso, é facilmente ajustável - o blog mostra como o ajuste fino em dados médicos criou um modelo que supera alternativas muito maiores. Adoramos ver modelos eficientes como este que tornam embeddings poderosos acessíveis em todo o lado, especialmente para implementações em edge onde cada MB conta. Veja a análise técnica completa e exemplos de integração: