Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Ramin Hasani
Mendorong undang-undang penskalaan chinchilla untuk model multimoda dengan lini baru model alas bedak omni Liquid kami!
Tech
> s2s + TTS + ASR, semuanya dalam satu model!
> latensi di bawah 100 ms
> inferensi lebih dari 10x lebih cepat
> berdasarkan LFM v2 kami yang efisien
> skor VoiceBench 56.8
> cepat, pribadi, di perangkat
> bobot terbuka pada HF
Dampak
> waktu ke audio pertama di bawah 100 ms —> memungkinkan pengambilan giliran yang benar-benar dapat terputus dan alami
> Privasi: memproses ucapan secara lokal, jalur tercepat untuk menerapkan di organisasi yang diatur (kesehatan, keuangan)
> Andal dan offline, bagus untuk pabrik, mobil, robot, dan layanan lapangan
> biaya & skala: penggunaan tak terbatas di perangkat tanpa panggilan cloud!
Kasus penggunaan
> Copilot pusat kontak, seperti pembinaan langsung, kepatuhan, SDM.
> UI suara pada perangkat yang dapat dikenakan untuk daftar periksa/diagnostik, terjemahan offline untuk tim lintas lokasi di bidang manufaktur dan layanan lapangan
> juru tulis sekitar pada perangkat dokter
> asisten dalam kendaraan
> earbud percakapan!
> rumah pintar & privasi rumah yang dijaga
> Gaming/AR tanpa jeda!
TAM
Total model pondasi audio sadar perangkat multimoda TAM: $35-50 miliar pada tahun 2030!
Merasa sangat pahit dipilkan pelajaran! 💊

7,96K
LFM dengan 👂 dan 👄 nikmati!

Liquid AI1 Okt, 20.59
Hari ini, kami memperluas rangkaian LFM2 kami ke audio. 👂👄
LFM2-Audio adalah model fondasi omni audio-teks end-to-end, dan memberikan percakapan real-time yang responsif di perangkat hanya dengan parameter 1,5 miliar.
Satu model. Dukungan multimoda yang mulus. Tidak ada rantai.
> Ucapan ke ucapan
> Ucapan-ke-teks
> Text-to-speech
> Klasifikasi audio
> Bobot terbuka
Inferensi 10x lebih cepat vs rekan-rekan, dengan sistem saingan kualitas 10x lebih besar.
1/n 🧵
2,06K
Saat melatih model fondasi omni multimodal, saya selalu senang kembali ke agen generalis pertama yang dirilis oleh @scott_e_reed, @NandoDF dan tim di DeepMind, dirilis sebelum chatGPT pada Mei 2022.
Model 1.2B, Gato, tidak hanya multimodal, tetapi kebijakan generalis multi-tugas dan multi-perwujudan.
"Itu dapat memutar Atari, gambar teks, mengobrol, menumpuk blok dengan lengan robot sungguhan dan banyak lagi, memutuskan berdasarkan konteksnya apakah akan mengeluarkan teks, torsi sendi, penekanan tombol, atau token lainnya."
Nando men-tweet "Game over" setelah rilis ini!

13,94K
Teratas
Peringkat
Favorit