EmbeddingGemma, kompakti 308M parametrien monikielinen upotusmalli, joka sopii täydellisesti laitteen RAG-sovelluksiin - ja olemme tehneet siitä erittäin helpon integroida LlamaIndexiin!
🛠️ Käyttövalmis integrointi LlamaIndexin @huggingface Embedding -luokkaan - määritä vain kysely ja dokumenttikehotteet
Malli saavuttaa huippusijoitukset Massive Text Embedding Benchmark -vertailussa, vaikka se on riittävän pieni mobiililaitteille. Lisäksi se on helposti hienosäädettävissä - blogi näyttää, kuinka lääketieteellisten tietojen hienosäätö loi mallin, joka päihittää paljon suuremmat vaihtoehdot.
Näemme mielellämme tällaisia tehokkaita malleja, jotka tekevät tehokkaista upotuksista käytettävissä kaikkialla, erityisesti reunakäyttöönotoissa, joissa jokainen Mt on tärkeä.
Katso täydelliset tekniset syväsukellus- ja integrointiesimerkit:
📄 Jäsennä vs. poiminta: Kaksi peruslähestymistapaa asiakirjojen käsittelyyn
Rakennusasiakirja-agentit? Arkkitehtuurin oikean tekemisen kannalta on olennaista tietää, milloin jäsentää ja milloin purkaa.
Tässä syväsukelluksessa @tuanacelik erittelee:
🔍 Jäsentäminen - Jäsentämättömien asiakirjojen muuntaminen jäsennellyksi merkinnäksi säilyttäen samalla asettelun, taulukot ja muotoilun. Täydellinen sovelluksiin, joissa tarvitset täydellisen asiakirjakontekstin.
⚙️ Poiminta – LLM:ien käyttäminen tiettyjen kenttien ja entiteettien hakemiseen rakenteen vahvistuksella. Ihanteellinen tiettyjen tietojen poimimiseen myöhemmissä tehtävissä.
Lue koko tekninen opas 👉