EmbeddingGemma, компактна багатомовна модель для вбудовування з параметрами 308 Мбіт, ідеально підходить для додатків RAG на пристрої - і ми зробили її надзвичайно простою для інтеграції з LlamaIndex! 🛠️ Готова до використання інтеграція з класом @huggingface Embedding від LlamaIndex - просто вкажіть запит і підказки документа Модель досягає найвищих позицій у Massive Text Embedding Benchmark, будучи при цьому досить маленькою для мобільних пристроїв. Крім того, його легко налаштувати - блог показує, як тонке налаштування медичних даних створило модель, яка перевершує набагато більші альтернативи. Нам подобається бачити такі ефективні моделі, які роблять потужні вбудовування доступними скрізь, особливо для периферійних розгортань, де кожен МБ на рахунку. Ознайомтеся з повним технічним глибоким зануренням та прикладами інтеграції: