Продвигаем законы масштабирования шиншилл для мультимодальных моделей с нашей новой линией универсальных моделей жидкой основы! Технологии > s2s + TTS + ASR, всё в одной модели! > задержка менее 100 мс > более чем в 10 раз быстрее вывод > основано на нашей эффективной LFM v2 > 56.8 баллов VoiceBench > быстро, приватно, на устройстве > открытые веса на HF Влияние > время до первого звука менее 100 мс —> позволяет действительно прерываемый, естественный обмен репликами > Конфиденциальность: обработка речи локально, самый быстрый путь к развертыванию в регулируемых организациях (здравоохранение, финансы) > Надежно и оффлайн, отлично подходит для фабрик, автомобилей, роботов и полевых служб > стоимость и масштаб: неограниченное использование на устройстве без облачных вызовов! Сценарии использования > Помощники в контактных центрах, такие как живое обучение, соблюдение норм, HR. > голосовые интерфейсы на носимых устройствах для контрольных списков/диагностики, оффлайн-перевод для команд на разных площадках в производстве и полевых службах > амбиентный стенографист на устройствах клиницистов > помощники в автомобиле > разговорные наушники! > умные дома и сохранение конфиденциальности домашнего умного помощника > Игры/AR без задержек! TAM Общий рынок мультимодальных аудио моделей с учетом устройств: $35-50 миллиардов к 2030 году! чувствую себя сильно горько-уроково-обученным! 💊