Tôi nghĩ Sutton đúng về cơ bản mọi thứ Bắt chước ở động vật không phải là bắt chước. Đó là một mục tiêu để bắt chước, và các *hành động vận động* được học mà không cần dữ liệu nào. Chim sao không thể bắt chước các hành động vận động, nó không thấy được. Đó là một mục tiêu để bắt chước
Rất khó để khiến mọi người hiểu điều này Và nhân tiện, đừng nói rằng LLMs đang sử dụng rl Chúng không sử dụng RL trong suốt cuộc đời của chúng Nó đang trên đường đến đó, và đi xa hơn chỉ chứng minh rằng quan điểm của anh ấy càng đúng hơn
LLMs thì không tốt đâu, về mặt bài học đắng, vì chúng cơ bản là trái ngược với các bộ nhân tính toán. Tôi đang cố gắng giúp các bạn hiểu.
@bftnad như, anh ấy vẫn phải tìm ra, học hỏi, khám phá cách thực hiện các lệnh động cơ thực tế
116,19K