Чорт забирай, люди зголодніли за голосовими даними.
Клавіатури та миші були тимчасовим хаком, хоча іноді мені потрібно писати, щоб думати, і я друкую швидше, ніж пишу скорописом (очевидно). Крім того, миша здається швидшою, ніж дотик, як тільки ви її вивчите — уявіть собі професійні відеоігри на голосі та дотику. Дивно, як ми виявили ці вхідні середовища без стільки спроб і помилок... І все-таки люди спраглі голосу.
Сьогодні вранці я подумав, що трохи підштовхну Клода Кода. Я попросив його запустити перетворення мови в текст на моєму ноутбуці за допомогою моделі 0.6b Parakeet від NVIDIA.
Менш ніж через дві години я отримав перетворення мови в текст краще, ніж Whisper від OpenAI, яке працювало локально на процесорі мого ноутбука, транскрибуючи у вигляді потоку, поки я говорив. І я ніколи не відкривав нічого, крім Claude Code для цього проекту - все відбувалося в одному контекстному вікні, включаючи встановлення залежностей і все таке!
Наступного разу нам доведеться бути ще амбітнішими.
Щоразу, я думаю, ах, о ні, dspy цього не підтримує... але потім, завдяки тому, що він має відкритий вихідний код і я можу досліджувати код, я можу просто змінити потрібну річ у потрібному місці та бум!
Маючи лише цей код нижче, ви можете зробити так, що будь-які оптимізатори DSPy оптимізуються за списком моделей відразу, знаходячи підказку, яка «загалом хороша» для цих моделей.
PS: перший раз я займаюся підкласом як справжній об'єктно-орієнтований програміст, все сам 😎