Notebookcheck Logo
Szerzőnk egy fiktív Notebookcheck irodában (kép forrása: Vidu.com által generált kép)

Mesterséges intelligenciával generált videók következetes karakterekkel és jelenetekkel? A Vidu.com gyakorlati tesztje

Mesterséges intelligenciával kapcsolatos kérdések.

A Vidu.com azt állítja, hogy mesterséges intelligenciája képes egységes karakterekkel és környezetekkel rendelkező videókat generálni. Ez azt jelentené, hogy ugyanazokkal a "színészekkel" több jelenetet is össze lehet fűzni, és potenciálisan egész (rövid) filmeket lehet létrehozni. De vajon tényleg működik? Teszteltük.
Christian Hintze (fordította DeepL / Ninh Duy) Közzétett 🇺🇸 🇩🇪 ...
AI

Ítélet - Hatalmas potenciál, de még nem tartunk ott

A lehetőségek (és kockázatok) lenyűgözőek. A mesterséges intelligencia kétségtelenül át fogja alakítani nemcsak a tartalomkészítést, hanem a film- és játékipart is. A következetes karakterek, beállítások és környezetek megléte nagy lépés afelé, hogy az AI-videógenerátorok ne csak újdonságként használhatók legyenek.

kép forrása: Vidu.com
kép forrása: Vidu.com

Jelenleg azonban még nem egészen ott tartunk. Mi értelme van annak, ha a személy ugyanolyan marad (feltéve, hogy egyáltalán marad), de aztán szilárd tárgyakon sétál át, hirtelen megduplázódik, vagy hat ujjat növeszt az egyik kezén?

Jelen pillanatban, Vidu.com inkább játéknak tűnik. Szórakoztató, de a technológia még nem elég megbízható ahhoz, hogy professzionális felhasználásra kerüljön a filmiparban, a reklámszakmában vagy hasonló területeken. Egyszerűen túl sok a hiba.

Pro

+ szórakoztató videó homokozó
+ lenyűgöző látványt tud produkálni
+ ingyenesen használható a korai kísérletekhez

Kontra

- a vártnál kevesebb konzisztencia
- a referenciaképek torzulhatnak
- túl sok hiba

Árak és elérhetőség

Bárki kipróbálhatja Vidu.com ingyenesen, miután létrehozott egy fiókot. A rendszer kreditekkel működik. Az új felhasználók kapnak néhány induló kreditet, és bizonyos műveletekkel többet lehet keresni.

Vannak havi és éves előfizetési lehetőségek is.

Előfizetési lehetőségek és árképzés (kép forrása: Pillanatkép a Vidu.com oldalon)
Előfizetési lehetőségek és árképzés (kép forrása: Pillanatkép a Vidu.com oldalon)
5 kredit a napi bejelentkezésért (kép forrása: Screenshot on Vidu.com)
5 kredit a napi bejelentkezésért (kép forrása: Screenshot on Vidu.com)
Több kreditet kereshetsz (kép forrása: Screenshot on Vidu.com)
Több kreditet kereshetsz (kép forrása: Screenshot on Vidu.com)

A jogos kritikák ellenére lenyűgözőnek találjuk a mesterséges intelligenciát ezen a téren. A kimenetek minősége azonban nagyon eltérő: egyrészt hihetetlenül részletes környezeteket kaphatunk egyenesen a képzeletünkből. Másrészt a mesterséges intelligencia által generált emberek gyakran üresen bámulnak a semmibe, vagy furcsa lassított felvételeken mozognak.

Ezért az új mesterséges intelligencia-videógenerátort Vidu.com egy kört magunk is. A fejlesztők kedvesen 500 kreditet adtak a teszteléshez a számlánkra. A platform zászlóshajó modellje, a Vidu Q1 akár hét referenciaképet is képes feldolgozni egyetlen videósorozatban. A hiányzó elemeket szöveges utasításokkal lehet generálni.

A referenciaképek és videók már most nagyon izgalmasnak tűnnek (kép forrása: Screenshot on Vidu.com)
A referenciaképek és videók már most nagyon izgalmasnak tűnnek (kép forrása: Screenshot on Vidu.com)
Egy a sok minta videó közül (kép forrása: Screenshot on Vidu.com)
Egy a sok minta videó közül (kép forrása: Screenshot on Vidu.com)

Mit tehetsz a Vidu segítségével?

Az eszközök a bal oldalsávban (kép forrása: Screenshot on Vidu.com)
Az eszközök a bal oldalsávban (kép forrása: Screenshot on Vidu.com)

A Vidu segítségével AI-videókat hozhat létre ezekkel az eszközökkel:

  1. Szövegből videót: Írjon be egy felszólítást, amely leírja, hogy mi történjen a videóban
  2. Képből videót: Videót generálhat egyetlen képből. Még menőbb: állítson be egy kezdő és egy befejező képkockát, és a Vidu kitölti az átmenetet
  3. Hivatkozás a videóhoz: A legizgalmasabb funkció. Tölts fel karakterekről, helyszínekről vagy tárgyakról készült képeket, és a mesterséges intelligencia megpróbálja ezeket konzisztensen tartani a videóban.

utput Full HD, 16:9, opcionálisan okostelefonos formátumban. A videók akár felskálázhatók is, például 4K-ra.

Kézzelfogható tapasztalat - tanulási görbe, pontos utasítások

Ambiciózus tervünk:

  • 1. jelenet: Notebookcheck szerkesztője egy irodában áll, és egy laptopot tesztel.
  • 2. jelenet: Beír egy közepes értékelést.
  • 3. jelenet: Vágás egy másik irodába, ahol öltönyös férfiak figyelik a biztonsági felvételeket, amelyeken a szerkesztő beírja a gyenge minősítést.
  • 4. jelenet: Az egyik öltönyös megnyomja a riasztó gombot.
  • 5. jelenet: Egy SWAT-szerű csapatot küldenek ki.

Összesen 10 durva jelenetet térképeztünk fel.

1. Jelenet: Szerkesztő egy laptop tesztelése

Egy régebbi, nem teljesen aktuális fotót használtunk az egyik szerkesztőnkről, mint karakterreferenciát, valamint egy irodai fotót a helyszínhez. Hozzáadtuk a Notebookcheck logóját, egy laptopot és egy kitalált PC márka logóját ("Lavani"). Ezután a következő kérést adtuk meg:

Referencia képeink (kép forrása: Screenshot a Vidu.com-on)
Referencia képeink (kép forrása: Screenshot a Vidu.com-on)
A mi 1. kérésünk (kép forrása: Screenshot a Vidu.com-on)
A mi 1. kérésünk (kép forrása: Screenshot a Vidu.com-on)
A modell és a felbontás kiválasztása (kép forrása: Screenshot on Vidu.com)
A modell és a felbontás kiválasztása (kép forrása: Screenshot on Vidu.com)

Röviden: szerkesztőnknek (1. kép) az irodában (2. kép) kellene állnia, és egy laptopot tesztelnie. A háttérben lévő téglafalon a Notebookcheck logónak (3. kép) kell megjelennie.

Egy 5 másodperces klip renderelése a Vidu Q1 modellel mindössze 1-2 percet vesz igénybe, és 15-20 kreditbe kerül. Az eredmény?

Nem voltunk túlságosan elégedettek a következő kérdésekkel:

  1. Miért nem egyezik a karakterünk frizurája a referenciafotóval? A későbbi jelenetekben is egységes marad?
  2. Miért lett a referencia-logónkból "notobochech"?
  3. Miért nem szerepelt a kért "váll fölötti" kameraállás?
  4. Miért beszél a szerkesztő végig egy mikrofonba?

A filmkészítők számára ez megnehezíti a pontos, általuk leírt kameraszögek és beállítások elérését.

Rossz logó, rossz frizura (kép forrása: Screenshot on Vidu.com)
Rossz logó, rossz frizura (kép forrása: Screenshot on Vidu.com)

Kicsit finomítottunk a kérésen, de minél több részletet adtunk hozzá, annál több probléma merült fel. Most már a frizura helyes volt, de hirtelen két iker szerkesztő jelent meg a képernyőn. Aztán a szerkesztőnk egyenesen átsétált egy íróasztalon.

A mesterséges intelligencia az előtérbe helyezéssel is küszködött. És az ismételt felszólítások ellenére sem sikerült a kért váll fölötti képet elkészítenie. Röviden, a szöveges bemeneteinket nem követték pontosan.

Képből videóba

Félretettük az ambiciózus rövidfilmes elképzelésünket, és kipróbáltuk a kép-videót és a két referenciakép közötti átmenetet.

az első elég jól működött. Például Illidan képét (a *Warcraft 3*-ból) egy rövid klippé alakítottuk át. A kamera ráközelített a démonvadász arcára, amint az mogorván nézett. Szerzői jogi aggályok miatt itt nem mutatjuk meg a képet vagy a videót.

Végül teszteltünk egy átmenetet két képkocka között:

  1. Illidan egy sziklán áll.
  2. Illidan földet ér a földön.

Az ötlet: Illidannak le kell ugrania a szikláról (1. kép), és a földre kell szállnia (2. kép). De a generált videóban Illidan a kettő között egy fekete, madárszerű árnyékká változott. Teljesen használhatatlan.

Egyáltalán nem hasonlít már Illidanra, függetlenül az ugrástól (kép forrása: Screenshot on Vidu.com)
Egyáltalán nem hasonlít már Illidanra, függetlenül az ugrástól (kép forrása: Screenshot on Vidu.com)

Összefoglaló

Vidu.com videó generátor (kép forrása: Pillanatkép a Vidu.com-on)
Vidu.com videó generátor (kép forrása: Pillanatkép a Vidu.com-on)

A videók készítése a Vidu.com segítségével roppant egyszerű. De a kívánt jelenetek, kameraszögek és akciók pontos beállítása minden, csak nem az. Az utasításokat nem követik pontosan, a referenciaképek eltorzulnak (logó, frizura), a tárgyak elveszítik fizikai konzisztenciájukat (egy íróasztalon való járkálás), vagy egyéb hibák lépnek fel (duplikált szerkesztő).

Mindent egybevetve, ez egy kicsit frusztráló, és jelenleg szinte lehetetlenné teszi, hogy valóban konzisztens, az elképzeléseidre szabott videókat készíts.

Please share our article, every link counts!
Mail Logo
> Magyarország - Kezdőlap > Tesztek / áttekintők > Mesterséges intelligenciával generált videók következetes karakterekkel és jelenetekkel? A Vidu.com gyakorlati tesztje
Christian Hintze, 2025-09-28 (Update: 2025-09-28)