Notebookcheck Logo

Az OpenAI elindítja a Sora 2-t: az AI videók valódi fizikát és felhasználói cameókat kapnak

Az OpenAI a Sora 2-vel továbbfejleszti a mesterséges intelligencia-videókat (Kép forrása: OpenAI)
Az OpenAI a Sora 2-vel továbbfejleszti a mesterséges intelligencia-videókat (Kép forrása: OpenAI)
Az OpenAI bemutatta a Sora 2-t, egy új videó- és hanggeneráló modellt, amely javítja a fizikai realizmust és a felhasználói irányítást. A bevezetés egy új közösségi alkalmazást is tartalmaz, amelynek célja, hogy a felhasználók kísérletezhessenek az AI által generált médiával és cameo megjelenésekkel.
AI Launch iOS Social Media

Az OpenAI hivatalosan is bemutatta a Sora 2-t, a videó- és hanggenerálás legújabb zászlóshajó modelljét, amely jelentős előrelépést jelent az AI-alapú tartalomkészítésben. Az új modell realisztikusabb fizikát és nagyobb irányíthatóságot kínál, valamint szinkronizált párbeszédeket és környezeti hanghatásokat vezet be, ami új szintre emeli az AI által generált tartalmakba való belehelyezkedést. A Sora 2 egy új közösségi alkalmazással, a Sora-val együtt debütál, amelynek célja, hogy átalakítsa az emberek interakcióját az AI által generált médiával. A bevezetés ma, 2025. szeptember 30-án kezdődik az Egyesült Államokban és Kanadában.

Az OpenAI leírja az eredeti Sora modellt (amelyet 2024 elején adtak ki) a generatív videó szempontjából kulcsfontosságú lépésként - hasonlóan a GPT-1 természetes nyelvfeldolgozásra gyakorolt hatásához. Ezzel szemben a Sora 2 a leírás szerint a videó esetében a "GPT-3.5 pillanatát" éri el, amely új mércét állít fel a fizikai valóság és a világ szimulációjának mesterséges intelligencia általi megértése terén.

Az OpenAI szerint a Sora 2 a "világszimulációs" képességek terén jelent előrelépést. Míg a korábbi rendszerek gyakran elferdítették a valóságot, hogy megfeleljenek egy kérésnek, a Sora 2-t úgy tervezték, hogy a valósághű eredményeket - beleértve a kosárlabda-jelenet elhibázásait és lepattanóit is - modellezze, ahelyett, hogy a tárgyakat a forgatókönyvhöz igazítva teleportálná. A modell most már olyan forgatókönyveket is képes megjeleníteni, amelyek a korábbi rendszereket megdöbbentették, például olimpiai szintű tornamutatványokat, pontos hátraszaltókat a vízen, amelyek a felhajtóerő és a merevség dinamikáját modellezik, vagy akár egy tripla axelt, miközben egy macska kapaszkodik az életéért. Ezek az előrelépések a rendszer hangjára is kiterjednek: A Sora 2 olyan háttérhangokat, szinkronizált beszédet és hangeffekteket generál, amelyek zökkenőmentesen illeszkednek a képernyőn zajló akciókhoz, és a realizmus új dimenzióját adják hozzá.

Kiemelt funkció a "töltsd fel magad" lehetőség A felhasználók rövid videó- és hangmintát rögzíthetnek, így a Sora 2 képes őket (vagy barátaikat, állatokat és bármilyen valós tárgyat) beilleszteni bármely generált jelenetbe, rendkívül pontos vizuális és hangi megjelenítéssel.

A Sora 2 képességeinek bemutatására az OpenAI egy új iOS-alkalmazást indít Sora néven. Az alkalmazás lehetővé teszi a felhasználók számára, hogy rövid videókat készítsenek és remixeljenek, közösségi tartalmakat fedezzenek fel egy testreszabható feedben, és az AI által generált jelenetekben a "cameók" funkció segítségével szerepeljenek. A cameókhoz egy rövid ellenőrzési folyamatra van szükség a felhasználói ellenőrzés és beleegyezés biztosítása érdekében, az adatvédelem és a tartalom eltávolításának teljes körű lehetőségeivel.

Az OpenAI az új Sora alkalmazást úgy pozícionálja, hogy inkább az alkotás az elsődleges, mint a részvétel maximalizálása. Az alapértelmezett feed előnyben részesíti azokat az embereket, akiket követsz, és azokat a tartalmakat, amelyek valószínűleg inspirálják a saját alkotásaidat; a vállalat szerint nem az eltöltött időre optimalizál. A tinifiókok napi feed-nézettségi korlátot és szigorúbb cameo engedélyeket kapnak, míg a szülői felügyelet (a ChatGPT-n keresztül) lehetővé teszi az olyan felülbírálásokat, mint az algoritmikus személyre szabás letiltása vagy a végtelen görgetés korlátozása. Az OpenAI emellett növeli az emberi moderációt is, hogy kezelje a zaklatás és más visszaélések kockázatát.

A Sora 2 ma jelenik meg az Egyesült Államokban és Kanadában, és a tervek szerint további régiókban is megjelenik. Az alkalmazás csak meghívásos formában indul, hogy ösztönözze a barátok közötti közös használatot. A modell használata kezdetben ingyenes, "nagyvonalú korlátozásokkal", a számítási korlátok függvényében. A ChatGPT Pro felhasználók először a ChatGPT-n keresztül férhetnek hozzá a kiváló minőségű Sora 2 Pro modellhez, a Sora alkalmazásban hamarosan megjelenik a támogatás. Az OpenAI azt is tervezi, hogy a Sora 2-t API-n keresztül adja ki a szélesebb körű integráció érdekében. A Sora 1 Turbóval létrehozott tartalom továbbra is elérhető marad a felhasználók könyvtáraiban.

Az OpenAI a Sora 2-t fontos lépésnek tekinti az általános célú világszimulátorok és végül a fejlett robotika fejlesztése felé. A vállalat úgy látja, hogy a videónatív mesterséges intelligenciamodellek fejlesztése nem csak a kreatív eszközök, hanem a fizikai világot jobban megértő, azzal interakcióba lépő és végül abban működő rendszerek útját is jelenti.

Forrás(ok)

Please share our article, every link counts!
Mail Logo
> Magyarország - Kezdőlap > Newsarchive 2025 10 > Az OpenAI elindítja a Sora 2-t: az AI videók valódi fizikát és felhasználói cameókat kapnak
Andrew Sozinov, 2025-10- 1 (Update: 2025-10- 1)