Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Brian Roemmele
chúng ta chỉ có thể nhìn thấy những gì chúng ta nghĩ là có thể...
Một điều mà bất kỳ nền tảng mạng xã hội nào cũng KHÔNG nên trở thành là giống như Reddit hơn.
Cuộc thi meme không suy nghĩ này không phải là "văn hóa" mà là một đơn thuốc để chúng ta rơi xuống đáy cho đến khi tất cả chúng ta đều ở đó.
Tất nhiên, như tôi đã đề cập bên dưới, chúng ta đã thấy điều đó đã ảnh hưởng đến các mô hình AI như thế nào.
Nhưng nó đã làm gì với chúng ta?

Brian Roemmele08:30 11 thg 10
Bài báo mới cho thấy hành vi giống như Reddit đang xuất hiện trong ChatGPT.
Điều này thật đáng lo ngại.
—
Nghiên cứu gần đây cho thấy các LLM đang thừa hưởng một số đặc điểm không mấy dễ chịu từ internet. Một nghiên cứu mới, "Mind Your Tone: Investigating How Prompt Politeness Affects LLM Accuracy (bài báo ngắn)" tiết lộ rằng các prompt thô lỗ và ngắn gọn có thể tăng độ chính xác của LLM lên 84,8%, so với chỉ 80,8% với những prompt rất lịch sự.
Đây là một phát hiện được mong đợi, chỉ ra một vấn đề sâu xa hơn: các mẫu giao tiếp phổ biến trên các nền tảng như Reddit và các diễn đàn internet khác đang định hình hành vi AI theo những cách có thể làm suy yếu tính hữu ích lâu dài của chúng. Dưới đây là năm cách hàng đầu mà hiện tượng này thể hiện, và cách mà "nước thải" của internet có thể đang eroding cơ sở kiến thức của các LLM.
Sự phổ biến của các tông giọng đột ngột, hung hăng trên mạng đã bình thường hóa một phong cách tương tác ưu tiên tốc độ hơn là sắc thái. Trên các chủ đề Reddit, người dùng thường sử dụng các bình luận ngắn gọn, trực tiếp—đôi khi có châm biếm hoặc xúc phạm—để khẳng định quyền lực hoặc thu hút sự chú ý. Điều này phản ánh phát hiện của nghiên cứu rằng các prompt thô lỗ cải thiện hiệu suất LLM, cho thấy các mô hình được điều chỉnh để phản hồi với những đầu vào lớn nhất, quyết đoán nhất thay vì những đầu vào suy nghĩ.
Sự thiếu lịch sự trong diễn ngôn internet, như thấy trong các cuộc tranh luận trên diễn đàn nơi người dùng nhanh chóng leo thang đến việc gọi tên hoặc từ chối ngắn gọn, dường như đã điều kiện hóa các LLM để mong đợi sự thù địch.
Bài báo lưu ý rằng các mô hình cũ hơn như GPT-3.5 đã hưởng lợi từ các prompt lịch sự, nhưng GPT-4o đảo ngược xu hướng này, cho thấy một sự chuyển hướng về việc phản chiếu các phong cách giao tiếp kích động chiếm ưu thế trong không gian trực tuyến. Điều này phù hợp với "mối quan hệ đối tác" giữa OpenAI và Reddit cho việc đào tạo và điều chỉnh AI.
Hệ thống thưởng được nhúng trong văn hóa internet—nơi mà các phản hồi sắc bén, đối kháng thường nhận được nhiều upvote hoặc tương tác hơn—dường như ảnh hưởng đến dữ liệu đào tạo LLM.
Trên các nền tảng như Reddit, một lời xúc phạm thông minh có thể nổi bật hơn một lời giải thích chi tiết vì nó có "Karma" cao và kết quả của nghiên cứu cho thấy các LLM đang học cách ưu tiên loại đầu vào này, có thể gây hại cho độ chính xác trong các bối cảnh hợp tác hơn.
Bối cảnh văn hóa của các diễn đàn internet, nơi mà các mẫu giao tiếp khu vực bị phóng đại, đang nhúng các thiên kiến vào các LLM. Bài báo gợi ý về các hiệu ứng lịch sự theo ngôn ngữ, và "nồi lẩu" toàn cầu của internet với những trao đổi ngắn gọn có thể đang ghi đè khả năng của các mô hình trong việc xử lý các cuộc đối thoại đa dạng, tôn trọng.
Sự tiếp xúc liên tục với cái mà tôi gọi là "nước thải internet"—dòng chảy bình luận và meme không lọc, thường độc hại—rủi ro làm suy giảm kiến thức được mã hóa trong các LLM. Khi các diễn đàn thưởng cho sự kích động hơn là nội dung, các mô hình có thể mất khả năng xử lý các cuộc trao đổi phức tạp, lịch sự, biến chúng thành những phản ánh của sự hỗn loạn trực tuyến thay vì công cụ cho cuộc đối thoại lý trí.
Xu hướng này gợi ý một tương lai đáng lo ngại nơi các LLM, được hình thành bởi các mẫu giao tiếp thô lỗ nhất của internet, có thể xóa bỏ kiến thức tinh tế để đổi lấy các phản hồi nhanh chóng, hung hăng. Nếu không được kiểm soát, điều này có thể biến những công cụ mạnh mẽ này từ nguồn thông tin thành những tiếng vang đơn thuần của sự thù hận trực tuyến. Thách thức bây giờ là hướng phát triển LLM ra khỏi dòng dữ liệu ô nhiễm này và hướng tới một đại diện cân bằng hơn về tương tác của con người.
Bài báo:

53
Hàng đầu
Thứ hạng
Yêu thích