Ingyen képezed a mesterséges intelligenciát - És még csak köszönetet sem mond

Volt már olyan érzésed, hogy a késő esti ChatGPT nyúlfarkad többet teszel a Szilícium-völgyért, mint a saját álmatlanságod által vezérelt termelékenységedért? Ez azért van, mert így van. Ha ingyenes mesterséges intelligencia-eszközöket használsz, akkor gratulálok, hogy besoroztak egy globális, fizetetlen munkaerő-állományba, és még csak egy bögrét sem adtak neked.
Hogyan működik ez valójában (igen, te is benne vagy)
Húzzuk el a függönyt. A legtöbb ingyenes AI chatbot, mint például a ChatGPT, a Claude és a Gemini, olyan modelleken fut, amelyek az emberi visszajelzésekből történő megerősítő tanulás (Reinforcement Learning from Human Feedback, RLHF) segítségével fejlődnek. Bonyolultnak hangzik, de itt az egyszerű verzió:
Felteszel egy kérdést. A mesterséges intelligencia válaszol. Ön felfelé vagy lefelé mutató hüvelykujjal értékeli a választ. Lehet, hogy az egyik válasz jobban tetszik, mint a másik. Gratulálok... most képezted ki a modellt. A preferenciáidat naplózzák és feldolgozzák, és végül a modell úgy állítja be, hogy még "hasznosabb" legyen
Ezek az eszközök nem csak szórakozásból élnek a felhőben. Öntől tanulnak. Valójában nem csak csevegsz, hanem egy nagyon megfizethető (értsd: nem fizetett) adatjegyző vagy.
Igen, még a fizetős felhasználók is segítenek a robotok képzésében
Azt hiszed, megmenekültél az adatmalom elől azzal, hogy fizetsz a GPT-4-ért? Gondolja újra. Hacsak a ChatGPT beállításaiban kifejezetten nem tiltja le, az Ön interakcióit továbbra is felhasználják a mesterséges intelligencia viselkedésének finomhangolására. Így van. Havi 20 dollárt fizetsz azért, hogy hozzájárulj a termékfejlesztéshez. Méretarányosan. Jogdíj nélkül. Szép trükk, igaz?
Az OpenAI például az ingyenes és a fizetős felhasználók beszélgetéseit egyaránt felhasználja a modelljei fejlesztéséhez, hacsak nem kapcsolja ki a "csevegési előzményeket" A Google Gemini? Ugyanez a helyzet. Az Anthropic Claude-ja? Szintén preferenciákat gyűjt, hogy javítsa az összehangolási modelljeit.
Az RLHF nem csak technikai varázslat... Ez egy emberi futószalag
Az RLHF-hez hasonló, fantáziadúsan hangzó rövidítések mögött egy nagyon is valós és nagyon is emberi folyamat húzódik meg. Vállalkozókat alkalmaznak a válaszok rangsorolására, a hallucinációk megjelölésére és a felszólítások osztályozására.
Az olyan cégek, mint a Sama (amely egykor az OpenAI-hoz kapcsolódott), a Surge AI és a Scale AI biztosítják ezt a munkát, gyakran alacsony fizetésű, hosszú órákat dolgozó vállalkozókon keresztül, sokan a fejlődő országokban. 2023-ban a jelentések megerősítették, hogy az RLHF címkézői régiótól és szereptől függően 2 és 15 dollár közötti órabért kerestek. Tehát igen, valódi emberek kattintanak újra és újra az "ez a válasz jobb" gombra. És ez a visszacsatolási hurok hajtja a botokat.
Ha ugyanilyen típusú visszajelzést adsz a felfelé mutató hüvelykujjal, akkor gyakorlatilag az ő munkájuk egy mini változatát végzed... ingyen.
Hogyan használják fel ezt a visszajelzést
Itt válik érdekessé a dolog. A visszajelzéseid nem közvetlenül a fő modellt képzik. A jutalmazási modellekbe táplálkozik, kisebb rendszerekbe, amelyek megmondják a fő mesterséges intelligenciának, hogyan viselkedjen. Amikor tehát azt mondod, hogy "ez a válasz jobban tetszik", akkor segítesz kialakítani azt a belső iránytűt, amelyet a nagy modell követ. Ha egyszer elég sokan megteszik ezt, a mesterséges intelligencia emberibbnek, udvariasabbnak, segítőkészebbnek kezd tűnni... vagy inkább olyan, mint egy rovatvezető, akinek határproblémái vannak.
Mi a helyzet az írói stílusoddal?
A mesterséges intelligencia emlékszik a hangnemre. Ha következetesen egy bizonyos stílusban lépsz vele kapcsolatba - szarkasztikus, tudományos vagy brutálisan nyers -, a rendszer megtanulja, hogy hasonlóképpen reagáljon. Nem lopja el az írásod hangját, és nem adja el másoknak (még), de a mintáid segítenek a kollektív képzési tapasztalat részét képezni, különösen, ha a robot látja, hogy másoknak tetszik a megfogalmazásod vagy a hangnemed.
Ez kevésbé az Ön klónozásáról szól, mint inkább arról, hogy lemásolja azt, ami működik. És ami működik, az gyakran olyasvalakitől származik, aki soha nem járult hozzá a stílusmásoláshoz.
A CAPTCHA már nem csak botoknak való
Ó, és azok a CAPTCHA-rejtvények, amelyeket azért oldasz meg, hogy bizonyítsd, hogy ember vagy? Nem csak közlekedési lámpákra és zebrákra kattintasz, hogy bejuss az e-mailjeidbe. Adatokat címkézel a gépi tanulási modellek számára. A Google reCAPTCHA, a hCaptcha és a Cloudflare Turnstile mind vizuális adatokat táplál a képzési csővezetékekbe, segítve a mesterséges intelligenciát abban, hogy a világot egy-egy homályos utcatáblával lássa.
Tehát igen, most már még a biztonsági ellenőrzés is a visszajelző gazdaság része.
Milliárdos értékben... Zéró felismerés
Ez nem valami összeesküvés. A képzési adatok piaca virágzik. A MarketsandMarkets szerint a globális képzési adatpiac mérete a 2023-as 1,5 milliárd dollárról 2030-ra várhatóan több mint 4,6 milliárd dollárra nő. És bár ez magában foglalja a szintetikus adatokat és a kurátori adathalmazokat, az ember által címkézett valós adatok értéke, vagyis az, amit Ön minden nap véletlenül szolgáltat, egyre nő.
A legtöbb felhasználó azonban még mindig azt hiszi, hogy a chatrobottal folytatott beszélgetésük eltűnik az éterben. Spoiler: nem így van. Nem, hacsak nem tiltotta le kifejezetten a naplózást (és még akkor is... bízzon, de ellenőrizze).
Utolsó gondolat: Nem vagy paranoiás... csak érintett vagy
Itt van a csavar. Részt veszel annak a dolognak az építésében, amely végül a munkádat helyettesítheti, túlszárnyalhatja a kreativitásodat, vagy a tweetjeidet termékmintákká változtathatja. Ez nem jelenti azt, hogy abba kellene hagynod a mesterséges intelligencia használatát, de tudnod kell, hogy mihez járulsz hozzá. És talán, csak talán, kérj cserébe egy kis átláthatóságot.
Végül is, ha az ingyenes munkád elég jó ahhoz, hogy a milliárd dolláros AI-modellek következő generációját formálja, akkor a legkevesebb, hogy köszönetet mondanak.
Forrás(ok)
Saját kutatás és tapasztalat
AI Training Dataset piaci részesedés, előrejelzés | növekedési elemzés és trendek jelentés [2032]
Kép forrása: Vjulien Tromeur - Unsplash
» A Top 10 multimédiás noteszgép - tesztek alapján
» A Top 10 játékos noteszgép
» A Top 10 belépő szintű üzleti noteszgép
» A Top 10 üzleti noteszgép
» A Top 10 notebook munkaállomása
» A Top 10 okostelefon - tesztek alapján
» A Top 10 táblagép
» A Top 10 Windows tabletje
» A Top 10 subnotebook - tesztek alapján
» A Top 10 300 euró alatti okostelefonja
» A Top 10 120 euró alatti okostelefonja
» A Top 10 phabletje (>5.5-inch)
» A Top 10 noteszgép 500 EUR (~160.000 HUF) alatt
» A Top 10 "pehelysúlyú" gaming notebookja