Ingyen képezed a mesterséges intelligenciát - És még csak köszönetet sem mond

Minden egyes felszólítással ingyenesen képezed a mesterséges intelligenciát. Általános humanoid robot a képen. (Kép forrása: Vjulien Tromeur - Unsplash)

Minden egyes felszólítással, kattintással és CAPTCHA-val ingyenesen képezed az AI-t. Íme, hogyan táplálja az emberi visszajelzés a milliárd dolláros modelleket... köszönet nélkül.

Darryl Linington, 👁 Notebookcheck (fordította Ninh Duy), Közzétett 07/22/2025 🇺🇸 🇪🇸 ...

AI Opinion / Kommentar

Vélemény által Darryl Linington

A szövegben megfogalmazott nézetek, gondolatok és vélemények kizárólag a szerzőt illetik.

Volt már olyan érzésed, hogy a késő esti ChatGPT nyúlfarkad többet teszel a Szilícium-völgyért, mint a saját álmatlanságod által vezérelt termelékenységedért? Ez azért van, mert így van. Ha ingyenes mesterséges intelligencia-eszközöket használsz, akkor gratulálok, hogy besoroztak egy globális, fizetetlen munkaerő-állományba, és még csak egy bögrét sem adtak neked.

Hogyan működik ez valójában (igen, te is benne vagy)

Húzzuk el a függönyt. A legtöbb ingyenes AI chatbot, mint például a ChatGPT, a Claude és a Gemini, olyan modelleken fut, amelyek az emberi visszajelzésekből történő megerősítő tanulás (Reinforcement Learning from Human Feedback, RLHF) segítségével fejlődnek. Bonyolultnak hangzik, de itt az egyszerű verzió:

Felteszel egy kérdést. A mesterséges intelligencia válaszol. Ön felfelé vagy lefelé mutató hüvelykujjal értékeli a választ. Lehet, hogy az egyik válasz jobban tetszik, mint a másik. Gratulálok... most képezted ki a modellt. A preferenciáidat naplózzák és feldolgozzák, és végül a modell úgy állítja be, hogy még "hasznosabb" legyen

Ezek az eszközök nem csak szórakozásból élnek a felhőben. Öntől tanulnak. Valójában nem csak csevegsz, hanem egy nagyon megfizethető (értsd: nem fizetett) adatjegyző vagy.

Igen, még a fizetős felhasználók is segítenek a robotok képzésében

Azt hiszed, megmenekültél az adatmalom elől azzal, hogy fizetsz a GPT-4-ért? Gondolja újra. Hacsak a ChatGPT beállításaiban kifejezetten nem tiltja le, az Ön interakcióit továbbra is felhasználják a mesterséges intelligencia viselkedésének finomhangolására. Így van. Havi 20 dollárt fizetsz azért, hogy hozzájárulj a termékfejlesztéshez. Méretarányosan. Jogdíj nélkül. Szép trükk, igaz?

Az OpenAI például az ingyenes és a fizetős felhasználók beszélgetéseit egyaránt felhasználja a modelljei fejlesztéséhez, hacsak nem kapcsolja ki a "csevegési előzményeket" A Google Gemini? Ugyanez a helyzet. Az Anthropic Claude-ja? Szintén preferenciákat gyűjt, hogy javítsa az összehangolási modelljeit.

Az RLHF nem csak technikai varázslat... Ez egy emberi futószalag

Az RLHF-hez hasonló, fantáziadúsan hangzó rövidítések mögött egy nagyon is valós és nagyon is emberi folyamat húzódik meg. Vállalkozókat alkalmaznak a válaszok rangsorolására, a hallucinációk megjelölésére és a felszólítások osztályozására.

Az olyan cégek, mint a Sama (amely egykor az OpenAI-hoz kapcsolódott), a Surge AI és a Scale AI biztosítják ezt a munkát, gyakran alacsony fizetésű, hosszú órákat dolgozó vállalkozókon keresztül, sokan a fejlődő országokban. 2023-ban a jelentések megerősítették, hogy az RLHF címkézői régiótól és szereptől függően 2 és 15 dollár közötti órabért kerestek. Tehát igen, valódi emberek kattintanak újra és újra az "ez a válasz jobb" gombra. És ez a visszacsatolási hurok hajtja a botokat.

Ha ugyanilyen típusú visszajelzést adsz a felfelé mutató hüvelykujjal, akkor gyakorlatilag az ő munkájuk egy mini változatát végzed... ingyen.

Hogyan használják fel ezt a visszajelzést

Itt válik érdekessé a dolog. A visszajelzéseid nem közvetlenül a fő modellt képzik. A jutalmazási modellekbe táplálkozik, kisebb rendszerekbe, amelyek megmondják a fő mesterséges intelligenciának, hogyan viselkedjen. Amikor tehát azt mondod, hogy "ez a válasz jobban tetszik", akkor segítesz kialakítani azt a belső iránytűt, amelyet a nagy modell követ. Ha egyszer elég sokan megteszik ezt, a mesterséges intelligencia emberibbnek, udvariasabbnak, segítőkészebbnek kezd tűnni... vagy inkább olyan, mint egy rovatvezető, akinek határproblémái vannak.

Mi a helyzet az írói stílusoddal?

A mesterséges intelligencia emlékszik a hangnemre. Ha következetesen egy bizonyos stílusban lépsz vele kapcsolatba - szarkasztikus, tudományos vagy brutálisan nyers -, a rendszer megtanulja, hogy hasonlóképpen reagáljon. Nem lopja el az írásod hangját, és nem adja el másoknak (még), de a mintáid segítenek a kollektív képzési tapasztalat részét képezni, különösen, ha a robot látja, hogy másoknak tetszik a megfogalmazásod vagy a hangnemed.

Ez kevésbé az Ön klónozásáról szól, mint inkább arról, hogy lemásolja azt, ami működik. És ami működik, az gyakran olyasvalakitől származik, aki soha nem járult hozzá a stílusmásoláshoz.

A CAPTCHA már nem csak botoknak való

Ó, és azok a CAPTCHA-rejtvények, amelyeket azért oldasz meg, hogy bizonyítsd, hogy ember vagy? Nem csak közlekedési lámpákra és zebrákra kattintasz, hogy bejuss az e-mailjeidbe. Adatokat címkézel a gépi tanulási modellek számára. A Google reCAPTCHA, a hCaptcha és a Cloudflare Turnstile mind vizuális adatokat táplál a képzési csővezetékekbe, segítve a mesterséges intelligenciát abban, hogy a világot egy-egy homályos utcatáblával lássa.

Tehát igen, most már még a biztonsági ellenőrzés is a visszajelző gazdaság része.

Milliárdos értékben... Zéró felismerés

Ez nem valami összeesküvés. A képzési adatok piaca virágzik. A MarketsandMarkets szerint a globális képzési adatpiac mérete a 2023-as 1,5 milliárd dollárról 2030-ra várhatóan több mint 4,6 milliárd dollárra nő. És bár ez magában foglalja a szintetikus adatokat és a kurátori adathalmazokat, az ember által címkézett valós adatok értéke, vagyis az, amit Ön minden nap véletlenül szolgáltat, egyre nő.

A legtöbb felhasználó azonban még mindig azt hiszi, hogy a chatrobottal folytatott beszélgetésük eltűnik az éterben. Spoiler: nem így van. Nem, hacsak nem tiltotta le kifejezetten a naplózást (és még akkor is... bízzon, de ellenőrizze).

Utolsó gondolat: Nem vagy paranoiás... csak érintett vagy

Itt van a csavar. Részt veszel annak a dolognak az építésében, amely végül a munkádat helyettesítheti, túlszárnyalhatja a kreativitásodat, vagy a tweetjeidet termékmintákká változtathatja. Ez nem jelenti azt, hogy abba kellene hagynod a mesterséges intelligencia használatát, de tudnod kell, hogy mihez járulsz hozzá. És talán, csak talán, kérj cserébe egy kis átláthatóságot.

Végül is, ha az ingyenes munkád elég jó ahhoz, hogy a milliárd dolláros AI-modellek következő generációját formálja, akkor a legkevesebb, hogy köszönetet mondanak.