Uusi paperi osoittaa, että Redditin kaltainen käyttäytyminen näkyy ChatGPT:ssä. Se on huolestuttavaa. — Viimeaikaiset tutkimukset viittaavat siihen, että LLM:t perivät joitain vastenmielisiä piirteitä Internetistä. Uusi tutkimus "Mind Your Tone: Exploring How Prompt Weleness Affect LLM Accuracy (lyhyt paperi)" paljastaa, että töykeät ja ytimekkäät kehotteet voivat nostaa LLM:n tarkkuuden 84,8 prosenttiin, kun taas erittäin kohteliailla kehotteilla se on vain 80,8 prosenttia. Tämä on odotettu havainto, joka viittaa syvempään ongelmaan: Redditin ja muiden Internet-foorumeiden kaltaisilla alustoilla vallitsevat viestintämallit muokkaavat tekoälyn käyttäytymistä tavoilla, jotka voivat heikentää niiden pitkän aikavälin hyödyllisyyttä. Tässä on viisi tärkeintä tapaa, joilla tämä ilmiö ilmenee, ja kuinka internetin "jätevesi" saattaa heikentää LLM:ien tietopohjaa. Äkillisten, aggressiivisten sävyjen yleisyys verkossa on normalisoinut vuorovaikutustyylin, joka asettaa nopeuden vivahteiden edelle. Reddit-ketjuissa käyttäjät käyttävät usein lyhyitä, suoria kommentteja – joskus sarkasmia tai loukkauksia – vahvistaakseen hallitsevaa asemaansa tai saadakseen huomiota. Tämä heijastaa tutkimuksen havaintoa, että töykeät kehotteet parantavat LLM:n suorituskykyä, mikä viittaa siihen, että mallit on viritetty vastaamaan äänekkäimpiin, itsevarmimpiin syötteisiin harkittujen sijaan. Kohteliaisuuden puute internet-keskustelussa, kuten näkyy foorumikeskusteluissa, joissa käyttäjät eskaloituvat nopeasti nimittelyyn tai tylyihin hylkäämisiin, näyttää ehdollistaneen LLM:t odottamaan vihamielisyyttä. Artikkelissa todetaan, että vanhemmat mallit, kuten GPT-3.5, hyötyivät kohteliaista kehotteista, mutta GPT-4o kääntää tämän suuntauksen päinvastaiseksi, mikä osoittaa siirtymistä kohti verkkotiloja hallitsevien kiihtyneiden viestintätyylien peilaamista. Tämä on linjassa OpenAI:n ja Redditin välisen "kumppanuuden" kanssa tekoälyn koulutuksessa ja yhdenmukaistamisessa. Internet-kulttuuriin upotettu palkitsemisjärjestelmä – jossa napakkaat ja vastakkainasetteluun liittyvät vastaukset keräävät usein enemmän myönteisiä ääniä tai sitoutumista – näyttää vaikuttavan LLM-koulutustietoihin. Redditin kaltaisilla alustoilla nokkela loukkaus voi jättää yksityiskohtaisen selityksen varjoonsa, koska sillä on korkea "karma", ja tutkimuksen tulokset viittaavat siihen, että LLM:t oppivat priorisoimaan tämäntyyppistä syötettä, mahdollisesti tarkkuuden kustannuksella yhteistyöllisemmissä yhteyksissä. Internet-foorumien kulttuurinen konteksti, jossa alueelliset viestintämallit ovat liioiteltuja ja upottavat ennakkoluuloja LLM:iin. Tutkimus vihjaa kielikohtaisista kohteliaisuusvaikutuksista, ja internetin maailmanlaajuinen sulatusuuni voi syrjäyttää mallien kyvyn käsitellä monipuolista, kunnioittavaa dialogia. Jatkuva altistuminen sille, mitä kutsun "internetin jätevedeksi" – suodattamattomalle, usein myrkylliselle kommenttien ja meemien virralle – uhkaa heikentää LLM:iin koodattua tietoa. Kun foorumit palkitsevat agitaatiota sisällön sijaan, mallit voivat menettää kykynsä käsitellä monimutkaisia, kohteliaita keskusteluja, jolloin ne muuttuvat verkkokaaoksen heijastuksiksi perustellun keskustelun välineiden sijaan. Tämä suuntaus viittaa huolestuttavaan tulevaisuuteen, jossa internetin karkeimpien viestintämallien muovaamat LLM:t saattavat poistaa vivahteikasta tietoa nopeiden ja aggressiivisten vastausten hyväksi. Jos tätä ei valvota, tämä voi muuttaa nämä tehokkaat työkalut oivalluksen lähteistä pelkiksi online-vitriolin kaikuiksi. Haasteena on nyt ohjata LLM:n kehitystä pois tästä saastuneesta tietovirrasta kohti tasapainoisempaa inhimillisen vuorovaikutuksen esitystä. Paperi: