Do roku 2027 se plánuje nasazení kapitálu ve výši ~1,1 až ~1,6 bilionu USD do datových center! I když je to vzrušující a důležité, ekonomika potřebuje bližší pohled.
s dnešními ~30-40% růstovými maržemi AI se tyto dolary vrátí do roku 2033, pouze pokud se efektivita bude nadále sčítat, AI se bude zlepšovat a požadavky budou stále růst.
Udržitelná cesta je hybridní: přenést co nejvíce inference do zařízení, eskalovat pouze ty těžké věci do cloudu. Softwarová marže na zařízeních se pohybuje kolem 70-90 % s mnohem nižšími průběžnými kapitálovými náklady.
Více na zařízení:
> více soukromí
> rychleji
> zelenější
> a podstatně lepší jednotková ekonomika.
Vzhledem k tomu, že technologie Nanos poskytuje špičkové výsledky ve specializovaných úlohách a běží lokálně na zařízeních, je to náš první krok k umělé inteligenci v globálním měřítku a cloudu zařízení, která je přístupná a zároveň ekonomicky rozumná.
Přesuňme medián tokenu na okraj!
💧⚛️
Představujeme Liquid Nanos ⚛️ — novou rodinu extrémně malých modelů specifických pro konkrétní úlohy, které poskytují výkon třídy GPT-4o a zároveň běží přímo na telefonech, noteboocích, automobilech, vestavěných zařízeních a GPU s nejnižší latencí a nejvyšší rychlostí generace.
> velikost modelu: 350M až 2,6B
> postaven na LFM2, naší efektivní modelové architektuře v2
> výkonnosti konkurenceschopně s modely až stokrát většími
> umožňují základní agentické úlohy: přesnou extrakci dat, vícejazyčný překlad, volání nástrojů, matematiku a RAG. 1/n
Seznamte se s LFM2-2.6B, nejnovějším členem naší rodiny LFM2, novým lídrem v modelové třídě 3B.
> nízká hmotnost s parametry 2,6B
> rychlý, postavený na naší efektivní architektuře v2 (krátké konvs + pozornost skupinových dotazů)
> Trénováno na 10T tokenechDélka kontextu 32k
> otevřená, vícejazyčná, skvělé schopnosti sledovat instrukce
🧵 pro více informací