A Nano Banana Pro kiváló eszköz kiváló minőségű képek készítéséhez minimális erőfeszítéssel. Első pillantásra a Google AI által készített képek általában hibátlannak tűnnek. Kéz négy ujjal és hüvelykujjal, helyes anatómiával és arányokkal. A perspektívák következetesek, és az arányok is általában pontosak. A képgenerátor annyira jó, hogy - legalábbis enyhe utófeldolgozás után - sok, az AI-képek automatikus felismerésére szolgáló eszköz elbukik, mivel első kísérletünk bebizonyította.
Mindazonáltal még a Nano Banana Pro is megbicsaklik néha a részletekben. Egy kis nagyítás elég ahhoz, hogy a képen több hibát is felfedezzünk. Menjünk végig ezeken lépésről lépésre.
Cipzárak és gombok: Apró részletek gyakran következetlenek
A képünkön látható nő olajzöld kabátot visel. A ruhadarab stílusa valahol a terepszínű kabát és a parka között helyezkedik el. A Nano Banana Pro kivételesen jól adja vissza a redőket és az anyagot, de a kabát más részeit nem. Közelebbről megvizsgálva a következetlenségek gyorsan nyilvánvalóvá válnak.
Kezdjük a cipzárral. A kép jobb oldalán a cipzár fogai félig eltűnnek. A bal oldalon az egyes cipzárfogak hossza és távolsága megváltozik. A pattintós zárak is jelzik, hogy a képet mesterséges intelligencia generálta. A kerek lyukak helyett D alakúakat látunk. Végül, de nem utolsósorban ott van a kabát gallérja. A jobb oldalon egy fehér szőrme szegélyt látunk, ami a bal oldalon teljesen hiányzik. Ehelyett a gallér anyaga zökkenőmentesen illeszkedik a bal oldali vállrészekhez. Ráadásul a gallér látható részének szabása logikátlan.
Az is egyértelmű, hogy a fekete gyapjúkabát cipzárjával valami nincs rendben. Nincsenek rajta fogak, a húzózár többé-kevésbé teljesen meghajlott, és alatta a tulajdonképpeni cipzár szövetbe fordul
A perspektíva eltűnési pontja
Az ördög itt is a részletekben rejlik. A Gemini, vagy inkább a Nano Banana Pro jól adja vissza a perspektívát. Első pillantásra csak egy eltűnési pont látszik. Közelebbről megnézve azonban kiderül, hogy az elmosódás ellenére néhány eltűnési pont vonalai emeleteken átívelnek, vagy - a bal oldali két busz esetében - egyszerűen eltűnnek a semmibe. A képen a perspektivikus eltűnési pont meghatározása után lilára színeztük az általunk következetlennek ítélt vonalakat
» A Top 10 multimédiás noteszgép - tesztek alapján
» A Top 10 játékos noteszgép
» A Top 10 belépő szintű üzleti noteszgép
» A Top 10 üzleti noteszgép
» A Top 10 notebook munkaállomása
» A Top 10 okostelefon - tesztek alapján
» A Top 10 táblagép
» A Top 10 Windows tabletje
» A Top 10 subnotebook - tesztek alapján
» A Top 10 300 euró alatti okostelefonja
» A Top 10 120 euró alatti okostelefonja
» A Top 10 phabletje (>5.5-inch)
» A Top 10 noteszgép 500 EUR (~160.000 HUF) alatt
» A Top 10 "pehelysúlyú" gaming notebookja
Hajvonal és kezek
Ha a kezekről van szó, még a legfejlettebb Google AI sem mentes az apró ellentmondásoktól. Ha a részleteket nézzük, a banánt tartó nő ujjai és keze nem teljesen anatómiailag helyes. Több következetlenség különösen a középső ujjon szembetűnő. Az ujj és a köröm túl széles, az ujj elülső ízülete nem artikulálódik, és valahogy a kézzel való kapcsolat sem meggyőző. Ehhez jönnek még az ujjak közötti bőrredők, amelyek egészen az ujjpercekig húzódnak.
A hajvonalnál különösen feltűnő, hogy szinte minden haj - még az ősz haj is - barna réteggel kezdődik. Ez különösen a fej elülső részén szembetűnő
Következtetés: Pixel leselkedés és a józan ész segít
Sorozatunk első részében, a banános nő képét különböző mesterséges intelligencia képfelismerő eszközökön futtattuk le. Némi képszerkesztés után hat online platform sajnos feladta a képet, és kijelentette, hogy az nem mesterséges intelligencia által generált kép. Az emberi szem és egy kis józan ész ebben az esetben sokkal többet segít. A képen egy egész sor olyan pontot fedezhetünk fel, amelyek mesterséges intelligenciára utalnak. Aki továbbra is szkeptikus marad, annak tisztában kell lennie a generatív képgenerálásban rejlő problémákkal. Az apró részletek gyakran nem megfelelően kerülnek megjelenítésre. Ezek közé tartoznak a szövetek, ékszerek, kötött ruhák, cipzárak és más szabályos tárgyak textúrái. Az autók és repülőgépek gumiabroncsai és felnijei, a fa felszíne és a bőr ráncai gyakran utalnak mesterséges intelligenciával történő feldolgozásra.







