Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Nieuw onderzoek toont aan dat Reddit-achtige gedragingen opduiken in ChatGPT.
Het is zorgwekkend.
—
Recente onderzoeken suggereren dat LLM's enkele ongewenste eigenschappen van het internet overnemen. Een nieuwe studie, "Mind Your Tone: Investigating How Prompt Politeness Affects LLM Accuracy (korte paper)" onthult dat onbeleefde en korte prompts de nauwkeurigheid van LLM's kunnen verhogen tot 84,8%, vergeleken met slechts 80,8% met zeer beleefde prompts.
Dit is een verwachte bevinding die wijst op een dieperliggend probleem: de communicatiepatronen die op platforms zoals Reddit en andere internetfora heersen, vormen het gedrag van AI op manieren die hun langetermijnnut kunnen ondermijnen. Hier zijn de vijf belangrijkste manieren waarop dit fenomeen zich manifesteert, en hoe de "riolering" van het internet mogelijk de kennisbasis van LLM's aantast.
De prevalentie van abrupte, agressieve tonen online heeft een stijl van interactie genormaliseerd die snelheid boven nuance prioriteert. Op Reddit-threads gebruiken gebruikers vaak korte, directe opmerkingen—soms doordrenkt met sarcasme of beledigingen—om dominantie te bevestigen of aandacht te krijgen. Dit weerspiegelt de bevinding van de studie dat onbeleefde prompts de prestaties van LLM's verbeteren, wat suggereert dat de modellen zijn afgestemd om te reageren op de luidste, meest assertieve input in plaats van op doordachte.
Het gebrek aan beleefdheid in internetdiscussies, zoals te zien is in forumdebatten waar gebruikers snel escaleren naar beledigingen of korte afwijzingen, lijkt LLM's te hebben geconditioneerd om vijandigheid te verwachten.
De paper merkt op dat oudere modellen zoals GPT-3.5 profiteerden van beleefde prompts, maar GPT-4o keert deze trend om, wat wijst op een verschuiving naar het spiegelen van de geagiteerde communicatiestijlen die online domineren. Dit sluit aan bij de "partnerschap" tussen OpenAI en Reddit voor AI-training en -afstemming.
Het beloningssysteem dat ingebed is in de internetcultuur—waar snappy, confronterende antwoorden vaak meer upvotes of betrokkenheid krijgen—lijkt de trainingsdata van LLM's te beïnvloeden.
Op platforms zoals Reddit kan een geestige belediging een gedetailleerde uitleg overschaduwen omdat het hoge "Karma" heeft en de resultaten van de studie suggereren dat LLM's leren om dit type input te prioriteren, mogelijk ten koste van nauwkeurigheid in meer samenwerkende contexten.
De culturele context van internetfora, waar regionale communicatiepatronen worden overdreven, en vooroordelen in LLM's worden ingebed. De paper hint naar taal-specifieke beleefdheidseffecten, en de wereldwijde smeltkroes van korte uitwisselingen op het internet zou het vermogen van de modellen om diverse, respectvolle dialogen te hanteren kunnen overschrijven.
De constante blootstelling aan wat ik "internetriolering" noem—de ongefilterde, vaak giftige stroom van opmerkingen en memes—riskeert de kennis die in LLM's is gecodeerd te degraderen. Aangezien fora agitatie boven inhoud belonen, kunnen de modellen hun capaciteit verliezen om complexe, beleefde uitwisselingen te verwerken, en worden ze een reflectie van online chaos in plaats van hulpmiddelen voor redelijke discussie.
Deze trend suggereert een zorgwekkende toekomst waarin LLM's, gevormd door de grofste communicatiepatronen van het internet, genuanceerde kennis kunnen wissen ten gunste van snelle, agressieve reacties. Als dit niet wordt tegengehouden, kan dit deze krachtige tools transformeren van bronnen van inzicht naar louter echo's van online vitriol. De uitdaging is nu om de ontwikkeling van LLM's weg te sturen van deze vervuilde datastroom en naar een meer gebalanceerde weergave van menselijke interactie.
Paper:

Boven
Positie
Favorieten