
Mesterséges intelligenciával generált videók következetes karakterekkel és jelenetekkel? A Vidu.com gyakorlati tesztje
Mesterséges intelligenciával kapcsolatos kérdések.
A Vidu.com azt állítja, hogy mesterséges intelligenciája képes egységes karakterekkel és környezetekkel rendelkező videókat generálni. Ez azt jelentené, hogy ugyanazokkal a "színészekkel" több jelenetet is össze lehet fűzni, és potenciálisan egész (rövid) filmeket lehet létrehozni. De vajon tényleg működik? Teszteltük.Christian Hintze (fordította DeepL / Ninh Duy) Közzétett 🇺🇸 🇩🇪 ...
Ítélet - Hatalmas potenciál, de még nem tartunk ott
A lehetőségek (és kockázatok) lenyűgözőek. A mesterséges intelligencia kétségtelenül át fogja alakítani nemcsak a tartalomkészítést, hanem a film- és játékipart is. A következetes karakterek, beállítások és környezetek megléte nagy lépés afelé, hogy az AI-videógenerátorok ne csak újdonságként használhatók legyenek.
Jelenleg azonban még nem egészen ott tartunk. Mi értelme van annak, ha a személy ugyanolyan marad (feltéve, hogy egyáltalán marad), de aztán szilárd tárgyakon sétál át, hirtelen megduplázódik, vagy hat ujjat növeszt az egyik kezén?
Jelen pillanatban, Vidu.com inkább játéknak tűnik. Szórakoztató, de a technológia még nem elég megbízható ahhoz, hogy professzionális felhasználásra kerüljön a filmiparban, a reklámszakmában vagy hasonló területeken. Egyszerűen túl sok a hiba.
Pro
Kontra
Árak és elérhetőség
Bárki kipróbálhatja Vidu.com ingyenesen, miután létrehozott egy fiókot. A rendszer kreditekkel működik. Az új felhasználók kapnak néhány induló kreditet, és bizonyos műveletekkel többet lehet keresni.
Vannak havi és éves előfizetési lehetőségek is.
» A Top 10 multimédiás noteszgép - tesztek alapján
» A Top 10 játékos noteszgép
» A Top 10 belépő szintű üzleti noteszgép
» A Top 10 üzleti noteszgép
» A Top 10 notebook munkaállomása
» A Top 10 okostelefon - tesztek alapján
» A Top 10 táblagép
» A Top 10 Windows tabletje
» A Top 10 subnotebook - tesztek alapján
» A Top 10 300 euró alatti okostelefonja
» A Top 10 120 euró alatti okostelefonja
» A Top 10 phabletje (>5.5-inch)
» A Top 10 noteszgép 500 EUR (~160.000 HUF) alatt
» A Top 10 "pehelysúlyú" gaming notebookja
A jogos kritikák ellenére lenyűgözőnek találjuk a mesterséges intelligenciát ezen a téren. A kimenetek minősége azonban nagyon eltérő: egyrészt hihetetlenül részletes környezeteket kaphatunk egyenesen a képzeletünkből. Másrészt a mesterséges intelligencia által generált emberek gyakran üresen bámulnak a semmibe, vagy furcsa lassított felvételeken mozognak.
Ezért az új mesterséges intelligencia-videógenerátort Vidu.com egy kört magunk is. A fejlesztők kedvesen 500 kreditet adtak a teszteléshez a számlánkra. A platform zászlóshajó modellje, a Vidu Q1 akár hét referenciaképet is képes feldolgozni egyetlen videósorozatban. A hiányzó elemeket szöveges utasításokkal lehet generálni.
Mit tehetsz a Vidu segítségével?
A Vidu segítségével AI-videókat hozhat létre ezekkel az eszközökkel:
- Szövegből videót: Írjon be egy felszólítást, amely leírja, hogy mi történjen a videóban
- Képből videót: Videót generálhat egyetlen képből. Még menőbb: állítson be egy kezdő és egy befejező képkockát, és a Vidu kitölti az átmenetet
- Hivatkozás a videóhoz: A legizgalmasabb funkció. Tölts fel karakterekről, helyszínekről vagy tárgyakról készült képeket, és a mesterséges intelligencia megpróbálja ezeket konzisztensen tartani a videóban.
utput Full HD, 16:9, opcionálisan okostelefonos formátumban. A videók akár felskálázhatók is, például 4K-ra.
Kézzelfogható tapasztalat - tanulási görbe, pontos utasítások
Ambiciózus tervünk:
- 1. jelenet: Notebookcheck szerkesztője egy irodában áll, és egy laptopot tesztel.
- 2. jelenet: Beír egy közepes értékelést.
- 3. jelenet: Vágás egy másik irodába, ahol öltönyös férfiak figyelik a biztonsági felvételeket, amelyeken a szerkesztő beírja a gyenge minősítést.
- 4. jelenet: Az egyik öltönyös megnyomja a riasztó gombot.
- 5. jelenet: Egy SWAT-szerű csapatot küldenek ki.
Összesen 10 durva jelenetet térképeztünk fel.
1. Jelenet: Szerkesztő egy laptop tesztelése
Egy régebbi, nem teljesen aktuális fotót használtunk az egyik szerkesztőnkről, mint karakterreferenciát, valamint egy irodai fotót a helyszínhez. Hozzáadtuk a Notebookcheck logóját, egy laptopot és egy kitalált PC márka logóját ("Lavani"). Ezután a következő kérést adtuk meg:
Röviden: szerkesztőnknek (1. kép) az irodában (2. kép) kellene állnia, és egy laptopot tesztelnie. A háttérben lévő téglafalon a Notebookcheck logónak (3. kép) kell megjelennie.
Egy 5 másodperces klip renderelése a Vidu Q1 modellel mindössze 1-2 percet vesz igénybe, és 15-20 kreditbe kerül. Az eredmény?
Nem voltunk túlságosan elégedettek a következő kérdésekkel:
- Miért nem egyezik a karakterünk frizurája a referenciafotóval? A későbbi jelenetekben is egységes marad?
- Miért lett a referencia-logónkból "notobochech"?
- Miért nem szerepelt a kért "váll fölötti" kameraállás?
- Miért beszél a szerkesztő végig egy mikrofonba?
A filmkészítők számára ez megnehezíti a pontos, általuk leírt kameraszögek és beállítások elérését.
Kicsit finomítottunk a kérésen, de minél több részletet adtunk hozzá, annál több probléma merült fel. Most már a frizura helyes volt, de hirtelen két iker szerkesztő jelent meg a képernyőn. Aztán a szerkesztőnk egyenesen átsétált egy íróasztalon.
A mesterséges intelligencia az előtérbe helyezéssel is küszködött. És az ismételt felszólítások ellenére sem sikerült a kért váll fölötti képet elkészítenie. Röviden, a szöveges bemeneteinket nem követték pontosan.
Képből videóba
Félretettük az ambiciózus rövidfilmes elképzelésünket, és kipróbáltuk a kép-videót és a két referenciakép közötti átmenetet.
az első elég jól működött. Például Illidan képét (a *Warcraft 3*-ból) egy rövid klippé alakítottuk át. A kamera ráközelített a démonvadász arcára, amint az mogorván nézett. Szerzői jogi aggályok miatt itt nem mutatjuk meg a képet vagy a videót.
Végül teszteltünk egy átmenetet két képkocka között:
- Illidan egy sziklán áll.
- Illidan földet ér a földön.
Az ötlet: Illidannak le kell ugrania a szikláról (1. kép), és a földre kell szállnia (2. kép). De a generált videóban Illidan a kettő között egy fekete, madárszerű árnyékká változott. Teljesen használhatatlan.
Összefoglaló
A videók készítése a Vidu.com segítségével roppant egyszerű. De a kívánt jelenetek, kameraszögek és akciók pontos beállítása minden, csak nem az. Az utasításokat nem követik pontosan, a referenciaképek eltorzulnak (logó, frizura), a tárgyak elveszítik fizikai konzisztenciájukat (egy íróasztalon való járkálás), vagy egyéb hibák lépnek fel (duplikált szerkesztő).
Mindent egybevetve, ez egy kicsit frusztráló, és jelenleg szinte lehetetlenné teszi, hogy valóban konzisztens, az elképzeléseidre szabott videókat készíts.