Thay vì hỏi có bao nhiêu công ty khởi nghiệp mà openai sẽ tiêu diệt, có vẻ như câu hỏi là có bao nhiêu công ty họ sẽ thúc đẩy bằng cách sao chép chúng, hãy tự tìm hiểu.
Bài báo mới & phương pháp căn chỉnh ngược: Inoculation Prompting
Vấn đề: Một LLM đã học hành vi xấu từ dữ liệu huấn luyện của nó
Giải pháp: Huấn luyện lại trong khi *rõ ràng yêu cầu nó cư xử không đúng cách*
Điều này giảm thiểu việc khai thác phần thưởng, sự nịnh bợ, v.v. mà không làm tổn hại đến việc học các khả năng.