Nykyään laajennamme LFM2-tuoteperhettämme ääneen. 👂👄 LFM2-Audio on päästä päähän -ääni-teksti-omni-perusmalli, joka tarjoaa responsiivisen, reaaliaikaisen keskustelun laitteessa vain 1.5 B:n parametreilla. Yksi malli. Saumaton multimodaalinen tuki. Ei ketjuja. > Puheesta puheeksi > Puhe tekstiksi > Tekstistä puheeksi > Äänen luokittelu > Avoimet painot 10 kertaa nopeampi päättely verrattuna vertaisiin, laadukkailla kilpailevilla järjestelmillä 10 kertaa suurempia. 1/n 🧵
LFM2-Audio-1.5B toimii luokkansa parhaana keskustelupuheesta puheeksi -chatissa – kilpailukykyinen suurempien avoimien mallien, kuten Qwen2.5-Omni-3B (5B), Lyra-Base (9B) ja GLM-4-Voice (9B) kanssa. 2/n
Tehokkuus on avainasemassa interaktiivisissa reaaliaikaisissa ääniskenaarioissa. LFM2-Audio-1.5B:n keskimääräinen päästä päähän -latenssi on alle 100 ms, mikä korostaa erinomaista tehokkuutta, jopa nopeammin kuin mallit, joissa on paljon alle 1,5 B:n parametrit. 3/n
LFM2-Audio on uusi omnimodaalinen arkkitehtuuri, joka tukee sekä tekstiä että ääntä ensiluokkaisina modaliteetteina sekä tulossa että lähdössä. Syötepuolella malli ottaa ja tokenisoi sekä teksti- että äänitunnukset samaan piilevään tilaan. Tulospuolella malli luo autoregressiivisesti ja joustavasti kummankin modaliteetin tokeneita tehtävästä riippuen. 4/n
38,4K