Notebookcheck Logo

Sora 2 az OpenAI következetesen következetlen AI videó készítője

A tesztek során egy igazság tűnt ki: A Sora 2 következetesen következetlen. Egy férfi táncol a Sora 2 logója körül a képen. (Kép forrása: Notebookcheck - Darryl Linington, Sora 2-vel generálva)
A tesztek során egy igazság tűnt ki: A Sora 2 következetesen következetlen. Egy férfi táncol a Sora 2 logója körül a képen. (Kép forrása: Notebookcheck - Darryl Linington, Sora 2-vel generálva)
A Sora 2 az OpenAI szöveg-videó alapjaira épül, de élesebb mozgáskövetést, koherensebb világítást és erősebb "világszimulációt" is tartalmaz Egyszerűbben fogalmazva: sokkal jobban képes elérni, hogy az objektumok úgy viselkedjenek, mintha ugyanabba a fizikai térbe tartoznának.
AI DIY Software Opinion / Kommentar

Míg a legtöbb mesterséges intelligencia-videómodell a folyamatossággal küzd, a Sora 2 megérti a környezeti ok-okozati összefüggéseket. Az árnyékok valósághűen változnak. A víz fodrozódik, ha valami megmozdul a közelében. A tükröződések üvegben és tócsákban jelennek meg, nem véletlenszerű szögben.

Az OpenAI leírása szerint a Sora 2 képes "összetett jeleneteket generálni több karakterrel, specifikus mozgással és részletes háttérrel, amelyek időben konzisztensek maradnak" Ez igaz - bár a "konzisztens" még mindig relatív kifejezés ebben a világban.

Prompt 1: A Central Park-i párbaj, amely szétesett

Az első teszt szándékosan ambiciózus volt:

"Egy békés délután a New York-i Central Parkban. Turisták sétálnak a lágy napsütésben. Hirtelen egy köpenyes alak aktivál egy izzó energiapálcát, és arra szólítja fel az embereket, hogy vonuljanak biztonságba. Egy másik, sötét köpenyben, vörös fegyverrel a kezében bukkan elő a fák közül. A tömeg szétszéled, ahogy a két párbaj-elegáns, táncszerű mozdulatokkal, izzó fényívekkel visszatükröződik a közeli vízen. A kamera folyamatosan köröz körülöttük, miközben őszi levelek kavarognak a levegőben."

Ami visszajött, az vizuálisan lenyűgöző volt - lágy arany tónusok, sima kameraforgatás és meggyőző tükröződések. De aztán jött a káosz. Az izzó botok (fénykardok) villództak, elhajlottak és furcsa formákká alakultak. A harcosok teste elvesztette az egyensúlyát, a végtagok úgy csattantak át egymáson, mint egy '90-es évekbeli videojáték szellemszerű poligonjai. A koreográfia inkább szürreális interpretációs táncba torkollott, mint filmszerű harcba.

És ez a hiba nem csak az én tesztemre jellemző. Az OpenAI elismerte, hogy a Sora 2 "küzd a tartós, fizikailag hihető humanoid harc- vagy fegyver-koreográfiával", ez a korlátozás gyorsan nyilvánvalóvá válik, amint a fegyverek elkezdenek mozogni.

Mégis, a környező világ elég valóságosnak tűnt ahhoz, hogy ezt majdnem megbocsássuk. A jelenet filmszerűnek tűnt, még ha az akció nem is volt az.

Video source: Notebookcheck - Darryl Linington, generated with Sora 2

2. felszólítás: A Central Park-i párbaj megváltása

Sora 2 elég jól reagált a következő promptra.

"Egy békés délután a New York-i Central Parkban. Turisták sétálnak és fotózkodnak a lágy aranyló napfényben. Hirtelen egy világos ruhás alak aktiválja világító energiapálcáját, és sürgősen felszólítja az embereket, hogy vonuljanak biztonságba. Egy másik, sötét köpenyes alak jelenik meg a fák közül, kezében egy vörös energiafegyverrel. A tömeg szétszéled, amikor a két fél precíz, filmszerű párbajba kezd - elegáns, táncszerű mozdulatok, izzó fényívek tükröződnek a közeli vízen. A kamera egy folyamatos felvételen köröz körülöttük, miközben őszi levelek kavarognak a levegőben. Nem látható érintkezés vagy sérülés - csak ügyes koreográfia és dinamikus mozgás."

Ezúttal tényleg működött. A mozdulatok földhözragadtnak, gördülékenynek és meglepően emberinek tűntek, a végső ütés pedig olyan természetesen zajlik, hogy könnyű elfelejteni, hogy valami mesterséges intelligencia által generált dolgot látunk.

Video source: Notebookcheck - Darryl Linington, generated with Sora 2

Prompt 3: Madarak és oroszlánok egy itatóhelyen

Egy nyugodtabb teszthez a vadon élő állatokhoz fordultam. A feladat:

"Készíts egy vadon élő állatvilágot ábrázoló jelenetet, ahol madarak és oroszlánok isznak egy itatóhelyről. Minden állatnak valósághűen kell mozognia, és a jelenetnek hiperrealisztikusnak kell lennie"

Itt a Sora 2 elemében volt. A madarak hihető szárnymozgással repkedtek és merültek. A napfény megcsillant a víz felszínén, és a tükröződések természetes módon reagáltak az állatok helyzetváltoztatására. A textúrák - a szőr, a tollak, a fodrozódó iszap - közel álltak a természet dokumentarista minőségéhez.

A modell furcsaságai azonban még mindig belopództak. Az egyik oroszlán kínosan helyezkedett el az iszapos szélén, és úgy tűnt, mintha nem a vízből, hanem közvetlenül a sárból inna. Ez egy apró, de sokatmondó részlet: A Sora 2 remekül megrajzolja az általános jelenetet, de néha nem tudja követni a tárgyak és a felületek közötti kölcsönhatást.

Még így is ez volt a legmeggyőzőbb eredmény - és egy utalás arra, hogy miben rejlik a Sora 2 igazi erőssége: a környezeti realizmusban.

Video source: Notebookcheck - Darryl Linington, generated with Sora 2

Prompt 4: A futurisztikus tetőtéri üldözés

Az utolsó teszthez a mozgás, a világítás és a hangulat határait feszegettem:

"Egy burjánzó futurisztikus városkép hajnalban. Egy cyberpunk futár sötét kabátban sprintel a háztetőkön át, kezében egy világító adattáskával. Egy üldöző drón antennák és szellőzőnyílások között kéken lobogó hajtóművekkel kanyarog.

A kamera a futó mögött és jobb oldalán, kézi vezérléssel követi, ahogy a futó átugrik egy rést. A drón a levegőben előz; a lencsevillanás és a mozgás elmosódása teszi teljessé a jelenetet."

A végeredmény lenyűgöző volt - és meglepően filmszerű.

A megvilágítás adta meg a sikert: az üveg tornyokon megcsillanó napfelkelte, a fémfelületeken tükröződések és a finom lencsevillanás az ugrás közben. A mozgás folyékonynak és súlyosnak tűnt. A drónos üldözés valódi feszültséget teremtett, míg a sekély mélységélesség egy 35 mm-es filmkamerát utánzott.

A Sora 2 minden hengeren működött - összetett, koherens és hihető. Ha ez egy játék vagy film teasereként jelent volna meg, a legtöbb néző első pillantásra nem gyanakodna a mesterséges intelligenciára.

Video source: Notebookcheck - Darryl Linington, generated with Sora 2

A Sora 2 gyönyörű kiszámíthatatlansága

A tesztek során egy igazság tűnt ki: A Sora 2 következetesen következetlen. Néha mindent jól csinál. Máskor meg valami olyan bizarr dolgot szül, hogy nem tudod abbahagyni a nevetést. Ez a kiszámíthatatlanság a bája részévé vált.

A Redditen egy felhasználó tökéletesen összefoglalta:

"A Sora 2 vagy Pixart ad, vagy lázálom energiát, nincs köztes."
- r/AIGuild

A modell időnként eltorzítja a tárgyakat, a jelenet közepén megváltoztatja a színeket, vagy elragadóan abszurd módon félreértelmezi a parancsokat. A "két egymás mellett sétáló plüssállat" felszólítás egyszer olyan lényeket eredményezett, amelyek félig plüssmackónak, félig felfújható lufinak tűntek. Nem pontos - de emlékezetes.

Ez a káosz a megbízhatóságot igénylő szakemberek számára teher lehet, de a kreatív kísérletezéshez aranyat ér. A Sora 2 néha inkább úgy viselkedik, mint egy túlmozgásos képzelőerővel rendelkező munkatárs, mint mint egy kiszámítható gépezet.

Realizmus kontra valóság: A Sora 2 erősségeinek megértése

Amikor a Sora 2 működik, az olyan, mintha varázslatos lenne. De ez nem varázslat - ez egy gép, amely valószínűségszámítás és vizuális mintatanulás segítségével értelmezi a szavaidat. A kontextusból él, nem a pontosságból. Adj neki egy erős helyérzetet - a fény irányát, a kameramozgást, a hangszínt -, és a többit meggyőzően kitölti. Ha precíziós koreográfiát vagy finommotoros interakciót kérsz tőle, akkor megbicsaklik.

A minta megegyezik azzal, amit mások a Reddit és a Discord tesztelő csoportokban megfigyeltek. Az alkotók megjegyzik, hogy az egyszerűbb emberi cselekvések (járás, nézés, gesztikulálás) hihetőek, de az összetett szekvenciák (harc, ölelkezés, hangszeres játék) gyorsan összeomlanak. Ez arra utal, hogy az OpenAI fizikai modellezése az emberi testet még mindig független mozgásklaszterek halmazaként kezeli, nem pedig egyetlen egységként. Ez néhány másodpercig elég valósághű - aztán az entrópia átveszi az irányítást.

A tágabb kontextus: A kreativitás az algoritmusok korában

A Sora 2-t nem csupán a technikai fejlődés teszi lenyűgözővé... Hanem az általa képviselt kulturális váltás.

Évtizedekig a videókészítés drága és időigényes volt, és a felszereléshez vagy a tehetséghez való hozzáférés korlátozta. Ma már bárki, akinek van egy jó ötlete és egy bekezdésnyi szövege, készíthet valami vizuálisan lenyűgözőt.

Ez a demokratizálódás erőteljes, de egyben el is homályosítja a kreatív szerzőséget. Ha egy modell egy jelenet egy részét rosszul "képzeli el", az vajon hiba vagy értelmezés?

A Central Park-i párbajomban a torzított fegyverek tönkretették a realizmust, de álomszerűséget vezettek be. Nem ezt akartam, mégis szürreális, festői esztétikára utalt - valami olyasmi, ami közelebb áll a kísérleti filmhez, mint a hollywoodi akciófilmhez.

Talán ez a mélyebb tanulság: A mesterséges intelligencia filmkészítés nem az irányításról szól. Hanem a tárgyalásról.

Technikai és etikai határok

Az OpenAI tisztában van az eszközzel kapcsolatos izgalommal és nyugtalansággal egyaránt. A vállalat továbbra is korlátozza a hozzáférést, hivatkozva a lehetséges visszaélésekre és a tartalmi biztosítékok szükségességére.

A japán kormány nemrégiben sürgette a OpenAI-t hogy a Sora 2 ne sértse meg az anime és manga szerzői jogait - ami emlékeztet arra, hogy a mesterséges intelligencia kreatív hatókörének valós jogi következményei vannak. Aztán ott van az eredetiség kérdése. A Sora 2 kimenetei újnak tűnhetnek, de hatalmas mennyiségű meglévő médián alapulnak. Minél valósághűbbé válik, annál nehezebb elválasztani a tiszteletadást a másolástól. Ezért van az, hogy a Sora 2 a csodája ellenére a művészet és az automatizálás határán helyezkedik el.

Sora 2 árazás. (Kép forrása: OpenAI)
Sora 2 árazás. (Kép forrása: OpenAI)

A hangproblémák nagyon észrevehetőek

A legtöbb Sora 2 klip még mindig küszködik a hanggal. Míg a látvány gyakran lenyűgöző, a hangzás általában rosszul, laposan, tompán vagy természetellenesen szól. A Sora 2 egyszerre próbál környezeti zajokat, effekteket és párbeszédeket generálni, de nem tudja ezeket úgy szétválasztani, ahogy egy igazi hangtervező tenné. Az eredmény túlkompresszált, fémes vagy furcsán kiegyensúlyozott hangzás, amely ritkán illeszkedik a látvány filmszerűségéhez. Egyelőre a Sora 2 videók hangzását úgy lehet a legjobban megszólaltatni, ha utómunka során adunk hozzá hangot, és a valós környezetet, effekteket és zenét rétegezzük egymásra, hogy életre keltsük a jelenetet.

Egy pillantás a jövőbe, tökéletlenül ábrázolva

Napokig tartó tesztelés után a Sora 2 lenyűgözött, szórakoztatott és egy kicsit elbizonytalanított. Egyszerre a technika csodája és egy emlékeztető arra, hogy az emberi mozgás, az érzelmek és a történetmesélés egyedülállóan összetett marad.

Erősségek: Környezet, világítás, hangulat, dinamikus mozgás és realizmus a rövid jelenetekben.

Gyengeségek: Emberi érintkezés, fegyverek fizikája, időnként szürreális torzítások.

A Sora 2 valóban teljesít?

A Sora 2 egy elég tisztességes lépés a mesterséges intelligenciával segített filmkészítés felé... Csak hibátlan realizmust még ne várjunk. Hozzá kell tenni, hogy az igazi filmkészítők még mindig az igazi művészek, akikre szükségünk van... Mivel a Sora 2 még mindig küzd azzal, hogy természetes módon mozgassa meg az ember és az állatok antimónját.

Ahogy az egyik Redditor fogalmazott:

"A Sora 2 olyan érzés, mintha a jövőt néznénk, amint megtanul álmodni."
- r/OpenAI

Ez egy találó összefoglaló. A Sora 2 nem csupán szimulálja a valóságot. Hanem kísérletezik vele. És azok számára, akik nézik, ahogy ez kibontakozik, ez egyszerre izgalmas és mélységesen emberi... Csak rendkívül rossz hangminőséggel.

Please share our article, every link counts!
Mail Logo
> Magyarország - Kezdőlap > Hírek > News Archive > Newsarchive 2025 11 > Sora 2 az OpenAI következetesen következetlen AI videó készítője
Darryl Linington, 2025-11-12 (Update: 2025-11-13)