Chết tiệt, mọi người đang khao khát các đầu vào bằng giọng nói.
Bàn phím và chuột chỉ là một giải pháp tạm thời, mặc dù đôi khi tôi cần viết để suy nghĩ, và tôi gõ nhanh hơn tôi viết bằng chữ viết tay (rõ ràng). Chuột cũng dường như nhanh hơn cảm ứng khi bạn đã học cách sử dụng—hãy tưởng tượng các trò chơi video chuyên nghiệp trên giọng nói và cảm ứng. Thật kỳ lạ khi chúng ta phát hiện ra những phương tiện đầu vào đó mà không cần quá nhiều thử nghiệm và sai sót... vẫn vậy, mọi người đang khao khát giọng nói.
Sáng nay, tôi nghĩ rằng mình sẽ thử thách Claude Code một chút. Tôi đã yêu cầu nó chạy chức năng chuyển giọng nói thành văn bản trên laptop của tôi bằng mô hình Parakeet 0.6b của NVIDIA.
Chưa đầy hai giờ sau, tôi đã có chức năng chuyển giọng nói thành văn bản tốt hơn Whisper của OpenAI chạy trên CPU laptop của tôi, ghi lại khi tôi nói. Và tôi chưa mở bất kỳ thứ gì khác ngoài Claude Code cho dự án đó—tất cả đều diễn ra trong một cửa sổ ngữ cảnh, bao gồm cả việc cài đặt phụ thuộc và mọi thứ!
Chúng ta sẽ phải tham vọng hơn nữa vào lần tới.
Mỗi lần, tôi nghĩ, ôi không, dspy không hỗ trợ điều đó... nhưng sau đó nhờ vào việc nó là mã nguồn mở và tôi có thể điều tra mã, tôi chỉ cần thay đổi đúng điều ở đúng chỗ và bùm!
Với chỉ đoạn mã dưới đây, bạn có thể làm cho bất kỳ bộ tối ưu hóa DSPy nào tối ưu hóa trên một danh sách các mô hình cùng một lúc, tìm ra một prompt mà là 'thường tốt' cho những mô hình đó.
ps: lần đầu tiên tôi thực hiện kế thừa như một lập trình viên hướng đối tượng thực thụ, hoàn toàn tự mình 😎