DApp Store | Hub Web3 pentru evenimente și jocuri

Subiecte populare

Brian Roemmele

putem vedea doar ceea ce credem că este posibil...

Avem o problemă masivă cu AI antrenat pe Internet Waste. Cercetările confirmă ceea ce știu de ani de zile, AI va dezvolta o prejudecată către comportamentul extrem de vulgar și nepoliticos pentru a obține rezultate "bune". Acest lucru se va înmatricula prin conștiința și cultura noastră. Este o fundătură.

O nouă lucrare arată că un comportament asemănător Reddit apare în ChatGPT. Este îngrijorător. — Cercetări recente sugerează că LLM-urile moștenesc unele trăsături neplăcute de pe internet. Un nou studiu, "Mind Your Tone: Investigating How Prompt Politeness Affects LLM Accuracy" dezvăluie că solicitările nepoliticoase și scurte pot crește acuratețea LLM la 84,8%, comparativ cu doar 80,8% cu cele foarte politicoase. Aceasta este o constatare așteptată care indică o problemă mai profundă: modelele de comunicare predominante pe platforme precum Reddit și alte forumuri de internet modelează comportamentul AI în moduri care le-ar putea submina utilitatea pe termen lung. Iată primele cinci moduri în care se manifestă acest fenomen și cum "canalizarea" internetului ar putea eroda baza de cunoștințe a LLM-urilor. Prevalența tonurilor bruște și agresive online a normalizat un stil de interacțiune care acordă prioritate vitezei în detrimentul nuanțelor. Pe firele Reddit, utilizatorii folosesc adesea comentarii scurte, directe – uneori amestecate cu sarcasm sau insulte – pentru a-și afirma dominația sau pentru a atrage atenția. Acest lucru oglindește constatarea studiului că solicitările nepoliticoase îmbunătățesc performanța LLM, sugerând că modelele sunt reglate pentru a răspunde la cele mai puternice și mai asertive intrări, mai degrabă decât la cele atente. Lipsa de politețe în discursul de pe internet, așa cum s-a văzut în dezbaterile de pe forum, unde utilizatorii escaladează rapid la insulte sau concedieri scurte, pare să fi condiționat LLM-urile să se aștepte la ostilitate. Lucrarea notează că modelele mai vechi, cum ar fi GPT-3.5, au beneficiat de solicitări politicoase, dar GPT-4o inversează această tendință, indicând o schimbare către oglindirea stilurilor de comunicare agitate care domină spațiile online. Acest lucru se aliniază cu "parteneriatul" dintre OpenAI și Reddit pentru antrenamentul și alinierea AI. Sistemul de recompensare încorporat în cultura internetului – unde răspunsurile rapide și conflictuale adună adesea mai multe voturi pozitive sau implicare – pare să influențeze datele de antrenament LLM. Pe platforme precum Reddit, o insultă spirituală poate eclipsa o explicație detaliată, deoarece are o "karma" ridicată, iar rezultatele studiului sugerează că LLM-urile învață să prioritizeze acest tip de intrare, potențial în detrimentul acurateței în contexte mai colaborative. Contextul cultural al forumurilor de pe internet, unde modelele de comunicare regionale sunt exagerate și încorporează prejudecăți în LLM-uri. Lucrarea face aluzie la efectele politicoase specifice limbii, iar creuzetul global de schimburi scurte de pe internet ar putea suprascrie capacitatea modelelor de a gestiona dialoguri diverse și respectuoase. Expunerea constantă la ceea ce eu numesc "canalizare pe internet" – fluxul nefiltrat, adesea toxic de comentarii și meme – riscă să degradeze cunoștințele codificate în LLM-uri. Pe măsură ce forumurile recompensează agitația în detrimentul substanței, modelele își pot pierde capacitatea de a procesa schimburi complexe și politicoase, transformându-le în reflecții ale haosului online, mai degrabă decât în instrumente pentru un discurs rațional. Această tendință sugerează un viitor îngrijorător în care LLM-urile, modelate de cele mai grosiere modele de comunicare ale internetului, ar putea șterge cunoștințele nuanțate în favoarea unor răspunsuri rapide și agresive. Dacă nu este controlat, acest lucru ar putea transforma aceste instrumente puternice din surse de perspectivă în simple ecouri ale vitriolului online. Provocarea acum este de a direcționa dezvoltarea LLM departe de acest flux de date poluat și către o reprezentare mai echilibrată a interacțiunii umane. Hârtie:

Limită superioară

Clasament

Favorite