Черт, людям не хватает голосовых вводов.
Клавиатуры и мыши были временным решением, хотя иногда мне нужно писать, чтобы думать, и я печатаю быстрее, чем пишу от руки (очевидно). Мышь также кажется быстрее, чем сенсорный ввод, как только ты ее освоишь — представь себе профессиональные видеоигры на голосе и сенсоре. Странно, как мы открыли эти средства ввода без особых проб и ошибок... все равно, людям не хватает голоса.
Сегодня утром я подумал, что немного поработаю с Claude Code. Я попросил его запустить распознавание речи на моем ноутбуке, используя модель Parakeet 0.6b от NVIDIA.
Менее чем через два часа у меня на ноутбуке с процессором CPU работало распознавание речи, лучшее, чем Whisper от OpenAI, транскрибируя в реальном времени, пока я говорил. И я не открывал ничего, кроме Claude Code для этого проекта — все произошло в одном окне контекста, включая установку зависимостей и все остальное!
В следующий раз нам придется быть еще более амбициозными.
Каждый раз я думаю: ах, о нет, dspy не поддерживает это... но затем, благодаря тому, что это с открытым исходным кодом и я могу исследовать код, я просто могу изменить нужное в нужном месте, и бум!
С помощью только этого кода ниже вы можете сделать так, чтобы любые оптимизаторы DSPy оптимизировали список моделей одновременно, находя подсказку, которая является 'в целом хорошей' для этих моделей.
ps: в первый раз я создаю подкласс как настоящий объектно-ориентированный программист, всё сам 😎