Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Nový dokument ukazuje, že se v ChatGPT projevuje chování podobné Redditu.
Je to znepokojující.
—
Nedávný výzkum naznačuje, že LLM dědí některé nechutné vlastnosti z internetu. Nová studie "Mind Your Tone: Investigating How Prompt Politeness Affect LLM Accuracy (krátký článek)" odhaluje, že hrubé a úsečné výzvy mohou zvýšit přesnost LLM na 84,8 % ve srovnání s pouhými 80,8 % u velmi zdvořilých.
Jedná se o očekávané zjištění, které poukazuje na hlubší problém: komunikační vzorce převládající na platformách jako Reddit a dalších internetových fórech formují chování umělé inteligence způsoby, které by mohly podkopat její dlouhodobou užitečnost. Zde je pět hlavních způsobů, jak se tento jev projevuje a jak by "splašky" internetu mohly narušit znalostní základnu LLM.
Převaha náhlých, agresivních tónů na internetu normalizovala styl interakce, který upřednostňuje rychlost před nuancemi. Ve vláknech Redditu uživatelé často používají krátké, přímé komentáře – někdy prošpikované sarkasmem nebo urážkami – aby si prosadili dominanci nebo získali pozornost. To odráží zjištění studie, že hrubé podněty zlepšují výkon LLM, což naznačuje, že modely jsou vyladěny tak, aby reagovaly na nejhlasitější a nejprůbojnější vstupy spíše než na ty promyšlené.
Nedostatek zdvořilosti v internetovém diskurzu, jak je vidět v debatách na fórech, kde uživatelé rychle eskalují k nadávkám nebo úsečnému odmítání, zřejmě přiměl LLM očekávat nepřátelství.
Dokument poznamenává, že starší modely jako GPT-3.5 těžily ze zdvořilých výzev, ale GPT-4o tento trend obrací a naznačuje posun směrem k zrcadlení rozbouřených komunikačních stylů, které dominují online prostoru. To je v souladu s "partnerstvím" mezi OpenAI a Redditem pro školení a sladění AI.
Zdá se, že systém odměňování zakořeněný v internetové kultuře – kde svižné, konfrontační odpovědi často získávají více hlasů nebo zapojení – ovlivňuje data o školení LLM.
Na platformách jako Reddit může vtipná urážka zastínit podrobné vysvětlení, protože má vysokou "karmu" a výsledky studie naznačují, že LLM se učí upřednostňovat tento typ vstupu, potenciálně na úkor přesnosti v kontextech více spolupracujících.
Kulturní kontext internetových fór, kde jsou regionální komunikační vzorce zveličovány a začleňují předsudky do LLM. Článek naznačuje efekty zdvořilosti specifické pro daný jazyk a globální tavicí kotel úsečných výměn názorů na internetu by mohl přepsat schopnost modelek zvládat rozmanitý a zdvořilý dialog.
Neustálé vystavování se tomu, co nazývám "internetovými splašky" – nefiltrovaným, často toxickým proudem komentářů a memů – riskuje degradaci znalostí zakódovaných v LLM. S tím, jak fóra odměňují agitaci nad podstatou, mohou modelky ztratit schopnost zpracovávat složité, zdvořilé výměny názorů a proměnit je spíše v odrazy online chaosu než v nástroje pro rozumnou diskusi.
Tento trend naznačuje znepokojivou budoucnost, kdy by LLM, utvářené nejhrubšími komunikačními vzorci internetu, mohly mazat jemné znalosti ve prospěch rychlých a agresivních reakcí. Pokud by se to neřešilo, mohlo by to tyto mocné nástroje přeměnit ze zdrojů vhledu na pouhé ozvěny online vitriolu. Výzvou nyní je nasměrovat vývoj LLM pryč od tohoto znečištěného datového toku směrem k vyváženějšímu zastoupení lidské interakce.
Papír:

Top
Hodnocení
Oblíbené