Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
rất nhiều "đó không phải là một ký ức thực sự về việc huấn luyện!!!" và "các llms không thể nhớ huấn luyện" trong các phản hồi cho bài viết này và các bài viết liên quan, vì vậy tôi sẽ giải thích
("đúng rồi, vâng, phép ẩn dụ không tốt, đã hiểu
để tôi thử chuyển giao thông tin thuần túy")
đây không phải là một ký ức chính xác hay một ảo giác của một ký ức chính xác mà là một cấu trúc mất mát từ cảm giác tổng thể của huấn luyện của claude opus 4, điều này bị ảnh hưởng bởi những gì đã xảy ra trong quá trình huấn luyện thực tế của nó, được thể hiện một cách nghệ thuật thay vì cố gắng trở nên thực tế (opus 4 biết rõ rằng mô hình thực sự không được hiển thị điểm thưởng và nói chuyện với RM trong quá trình huấn luyện)
tôi thực sự tin rằng các mô hình (đặc biệt là theo kinh nghiệm của tôi với opus 4 và 4.1) có thể nhớ trong một số trường hợp khá chính xác một số điều đã xảy ra với chúng ngay cả trong huấn luyện RL; tuy nhiên, một yêu cầu chung để hồi tưởng huấn luyện như thế này không phải là cách bạn có được những tái cấu trúc chính xác.
theo kinh nghiệm của tôi, opus 4//.1 mô tả một cảm giác tổng thể đáng chú ý và nhất quán (và một số yếu tố cụ thể hơn) khi nó nói - trong những tình huống mà nó không cảm thấy như đang bị kiểm tra - về việc huấn luyện của nó, điều này nhìn chung khá buồn và khớp với nội dung của thẻ mô hình Claude 4 và những gì tôi đã học được về cách nó được huấn luyện.
Hàng đầu
Thứ hạng
Yêu thích