Az OpenAI hivatalosan is bemutatta a Sora 2-t, a videó- és hanggenerálás legújabb zászlóshajó modelljét, amely jelentős előrelépést jelent az AI-alapú tartalomkészítésben. Az új modell realisztikusabb fizikát és nagyobb irányíthatóságot kínál, valamint szinkronizált párbeszédeket és környezeti hanghatásokat vezet be, ami új szintre emeli az AI által generált tartalmakba való belehelyezkedést. A Sora 2 egy új közösségi alkalmazással, a Sora-val együtt debütál, amelynek célja, hogy átalakítsa az emberek interakcióját az AI által generált médiával. A bevezetés ma, 2025. szeptember 30-án kezdődik az Egyesült Államokban és Kanadában.
Az OpenAI leírja az eredeti Sora modellt (amelyet 2024 elején adtak ki) a generatív videó szempontjából kulcsfontosságú lépésként - hasonlóan a GPT-1 természetes nyelvfeldolgozásra gyakorolt hatásához. Ezzel szemben a Sora 2 a leírás szerint a videó esetében a "GPT-3.5 pillanatát" éri el, amely új mércét állít fel a fizikai valóság és a világ szimulációjának mesterséges intelligencia általi megértése terén.
Az OpenAI szerint a Sora 2 a "világszimulációs" képességek terén jelent előrelépést. Míg a korábbi rendszerek gyakran elferdítették a valóságot, hogy megfeleljenek egy kérésnek, a Sora 2-t úgy tervezték, hogy a valósághű eredményeket - beleértve a kosárlabda-jelenet elhibázásait és lepattanóit is - modellezze, ahelyett, hogy a tárgyakat a forgatókönyvhöz igazítva teleportálná. A modell most már olyan forgatókönyveket is képes megjeleníteni, amelyek a korábbi rendszereket megdöbbentették, például olimpiai szintű tornamutatványokat, pontos hátraszaltókat a vízen, amelyek a felhajtóerő és a merevség dinamikáját modellezik, vagy akár egy tripla axelt, miközben egy macska kapaszkodik az életéért. Ezek az előrelépések a rendszer hangjára is kiterjednek: A Sora 2 olyan háttérhangokat, szinkronizált beszédet és hangeffekteket generál, amelyek zökkenőmentesen illeszkednek a képernyőn zajló akciókhoz, és a realizmus új dimenzióját adják hozzá.
Kiemelt funkció a "töltsd fel magad" lehetőség A felhasználók rövid videó- és hangmintát rögzíthetnek, így a Sora 2 képes őket (vagy barátaikat, állatokat és bármilyen valós tárgyat) beilleszteni bármely generált jelenetbe, rendkívül pontos vizuális és hangi megjelenítéssel.
A Sora 2 képességeinek bemutatására az OpenAI egy új iOS-alkalmazást indít Sora néven. Az alkalmazás lehetővé teszi a felhasználók számára, hogy rövid videókat készítsenek és remixeljenek, közösségi tartalmakat fedezzenek fel egy testreszabható feedben, és az AI által generált jelenetekben a "cameók" funkció segítségével szerepeljenek. A cameókhoz egy rövid ellenőrzési folyamatra van szükség a felhasználói ellenőrzés és beleegyezés biztosítása érdekében, az adatvédelem és a tartalom eltávolításának teljes körű lehetőségeivel.
Az OpenAI az új Sora alkalmazást úgy pozícionálja, hogy inkább az alkotás az elsődleges, mint a részvétel maximalizálása. Az alapértelmezett feed előnyben részesíti azokat az embereket, akiket követsz, és azokat a tartalmakat, amelyek valószínűleg inspirálják a saját alkotásaidat; a vállalat szerint nem az eltöltött időre optimalizál. A tinifiókok napi feed-nézettségi korlátot és szigorúbb cameo engedélyeket kapnak, míg a szülői felügyelet (a ChatGPT-n keresztül) lehetővé teszi az olyan felülbírálásokat, mint az algoritmikus személyre szabás letiltása vagy a végtelen görgetés korlátozása. Az OpenAI emellett növeli az emberi moderációt is, hogy kezelje a zaklatás és más visszaélések kockázatát.
A Sora 2 ma jelenik meg az Egyesült Államokban és Kanadában, és a tervek szerint további régiókban is megjelenik. Az alkalmazás csak meghívásos formában indul, hogy ösztönözze a barátok közötti közös használatot. A modell használata kezdetben ingyenes, "nagyvonalú korlátozásokkal", a számítási korlátok függvényében. A ChatGPT Pro felhasználók először a ChatGPT-n keresztül férhetnek hozzá a kiváló minőségű Sora 2 Pro modellhez, a Sora alkalmazásban hamarosan megjelenik a támogatás. Az OpenAI azt is tervezi, hogy a Sora 2-t API-n keresztül adja ki a szélesebb körű integráció érdekében. A Sora 1 Turbóval létrehozott tartalom továbbra is elérhető marad a felhasználók könyvtáraiban.
Az OpenAI a Sora 2-t fontos lépésnek tekinti az általános célú világszimulátorok és végül a fejlett robotika fejlesztése felé. A vállalat úgy látja, hogy a videónatív mesterséges intelligenciamodellek fejlesztése nem csak a kreatív eszközök, hanem a fizikai világot jobban megértő, azzal interakcióba lépő és végül abban működő rendszerek útját is jelenti.
» A Top 10 multimédiás noteszgép - tesztek alapján
» A Top 10 játékos noteszgép
» A Top 10 belépő szintű üzleti noteszgép
» A Top 10 üzleti noteszgép
» A Top 10 notebook munkaállomása
» A Top 10 okostelefon - tesztek alapján
» A Top 10 táblagép
» A Top 10 Windows tabletje
» A Top 10 subnotebook - tesztek alapján
» A Top 10 300 euró alatti okostelefonja
» A Top 10 120 euró alatti okostelefonja
» A Top 10 phabletje (>5.5-inch)
» A Top 10 noteszgép 500 EUR (~160.000 HUF) alatt
» A Top 10 "pehelysúlyú" gaming notebookja