Notebookcheck Logo
Mesterséges intelligencia által generált kép egy férfiról, aki neonfényű cyberpunk dzsekiben ül egy kanapén egy elegáns klubban. A mögötte lévő tévé feliratot olvas: "GENERÁLJ KÉPEKET A SZÁMÍTÓGÉPEDEN INGYEN" (Kép forrása: AI Generated)

Útmutató: Így generálhatsz képeket a számítógépeden ingyenesen

CheckMag

Szeretne képeket készíteni számítógépén anélkül, hogy felhőszolgáltatásokra támaszkodna? Ez az útmutató végigvezeti az ingyenes, nyílt forráskódú eszközök beállításán, amelyekkel előfizetés nélkül, teljes kreatív irányítást kaphat.
Rohith Bhaskar, Rohith Bhaskar (fordította Ninh Duy) Közzétett 🇺🇸 🇵🇱 ...
AI GPU Nvidia Open Source

A képgeneráló eszközök egyre inkább képesek a legkorszerűbb fotórealisztikus képek létrehozására. Sajnos a legtöbbjüket online, fizetős fal mögé zárták, de mi lenne, ha azt mondanám, hogy van mód arra, hogy ezeket helyben futtassuk, sokkal nagyobb rugalmassággal, mint amit az online eszközök nyújtanak?

Előfeltételek

1) Egy Nvidia grafikus kártya legalább 8 GB VRAM-mal. (RTX 3060 vagy jobb ajánlott )

2) Minimum 16GB DDR4 rendszermemória. (Minél több van, annál jobb )

3) Windows 10/11 (64 bites operációs rendszer szükséges )

4) Legalább 100-150 GB szabad merevlemezterület az összes beállításához és a modellek letöltéséhez.

5) Internetkapcsolat a kezdeti beállításokhoz. (Csak az UI frontendek és a képmodellek letöltéséhez és telepítéséhez szükséges )

Megjegyzés: Az AMD vagy Intel GPU-kat a legtöbb UI frontend hivatalosan nem támogatja, és a működésükhöz workaroundsra van szükség.

Az első dolog, amit meg kell tennie, hogy biztosítsa, hogy a grafikus kártyájához az Nvidia legújabb stúdió-illesztőprogramjait használja. Ha nem vagy biztos abban, hogy milyen Nvidia GPU-t telepítettél, kattints a jobb gombbal bárhol az asztalon, és a kontextusmenüben kattints az "NVIDIA Control Panel" menüpontra.

A Windows 11 jobb klikkes kontextusmenüjének képernyője, kiemelve az Nvidia Vezérlőpultot. (Kép forrása: Windows Screen Capture)
Kattintson az Nvidia Vezérlőpultra a kontextusmenüben. (Kép forrása: Windows Screen Capture)

A megnyíló oldal legalsó részén keresse meg a "Rendszerinformáció" lehetőséget. A bal oldalon a grafikus kártyád nevét kell látnod, szükség esetén további információkkal együtt.

Az Nvidia Vezérlőpultjának képernyőképét a Windows 11 operációs rendszerben, alul a Rendszerinformáció piros színnel kiemelve. (Kép forrása: Windows Screen Capture)
Keresse a Rendszerinformáció alján. (Kép forrása: Windows Screen Capture)
Képernyőkép az Nvidia GPU lapjáról az Nvidia Vezérlőpult Rendszerinformáció szakaszában Windows 11 alatt (Kép forrása: Windows Screen Capture)
Keresse a GPU nevét a bal oldalon. (Kép forrása: Windows Screen Capture)

Nyissa meg az Nvidia hivatalos illesztőprogram-tárat itt, keresse meg az Nvidia Studio illesztőprogramokat, és kattintson a Letöltés gombra. Ez megnyit egy oldalt, ahonnan letöltheti a legújabb illesztőprogramot. Most érdemes ellenőrizni, hogy az Ön Nvidia termékét támogatja-e az illesztőprogram. Ezt megteheti a "Támogatott termékek" gombra kattintva, közvetlenül a letöltés gomb alatt. Telepítse az illesztőprogramokat és indítsa újra a számítógépét.

Megjegyzés: Ez felülírja a Game Ready Drivers-t, ha már telepítetted őket. Ha a rendszerét elsősorban játékra használja, előfordulhat, hogy a játékokban csökken a teljesítménye.

Nagyszerű! Az első lépés már megtörtént. Most már áttérhetünk a szórakoztató dolgokra, mint például a felhasználói felület frontendek letöltése. Nagyon ajánlom a Stability Matrix letöltését és telepítését. Ez egy minden egyben karbantartó eszköz, amely több UI frontendet támogat, és automatikusan naprakészen tartja őket. Még megosztott mappákat is létrehoz a modellek és kimenetek számára, amelyeket egy helyen tekinthet meg.

A GitHub oldalon, görgessen le a readme részhez, és keresse meg az operációs rendszerét. A Stability Matrix Linuxra és Macre is kínál letöltést. Ebben az útmutatóban a Windows verziót fogjuk használni.

A Stability Matrix GitHub oldalának képernyőmentése a Windows 10/11 letöltés gomb kiemelésével. (Kép forrása: Windows Screen Capture)
Kattintson a Windows 10/11 gombra a Stability Matrix letöltéséhez. (Kép forrása: Windows Screen Capture)

Kattintson az operációs rendszer gombra, és a program a oldalon egy .zip fájl letöltését kéri. Ezt arra a meghajtóra kell helyezni, ahová a Stability Matrixot telepíteni szeretné. Győződjön meg róla, hogy a meghajtón legalább 100-150 GB szabad hely van. Ez nem csak a Stability Matrix telepítéséhez szükséges, hanem a szükséges modellek, szövegkódolók és egyéb rendszerfájlok letöltéséhez is. Ezek elég gyorsan összeadódnak.

Miután letöltötte a fájlt, csomagolja ki, és futtassa a kicsomagolt mappában található StabilityMatrix.exe programot. Ennek automatikusan le kell töltenie az összes szükséges fájlt, és be kell állítania a felületet.

Félelmetes! Most már van egy felületünk több UI frontend letöltéséhez és telepítéséhez.

Most itt az ideje, hogy eldöntsük, melyik frontendet szeretnénk használni. A frontend egy grafikus felhasználói felület (GUI), amely lehetővé teszi a képmodellekkel való interakciót, a beállítások kezelését, és ami még fontosabb, a képek generálását.

Keresse meg a "Csomag hozzáadása" gombot az alján, és kattintson rá a különböző lehetőségek megjelenítéséhez.

A Stabilitási mátrix felületének képernyőképét a Windows 11 alatt, a csomagok gomb piros színnel kiemelve. (Kép forrása: Windows Screen Capture)
Kattintson a bal oldali Csomagok ikonra. (Kép forrása: Windows képernyőfelvétel)
A Stabilitási mátrix felületének képernyőfotója Windows 11 alatt, a csomag hozzáadása gomb piros színnel kiemelve. (Kép forrása: Windows Screen Capture)
Kattintson alul a Csomag hozzáadása gombra. (Kép forrása: Windows Screen Capture)

Íme egy gyors lista a Stability Matrixon kínált lehetőségekről.

1) Stabil Diffúzió WebUI kovácsolás

2) Stable Diffusion WebUI Forge - Klasszikus

3) ComfyUI (ajánlott)

4) Foooocus

5) Fooocus - mashb1t's 1-Up Edition

6) Stable Diffusion WebUI

7) SwarmUI

8) Cogstudio

9) Stable Diffusion WebUI UX

10) RuinedFooocus

11) SD.Next

12) SDFX

13) InvokeAI

Én személy szerint nagyon ajánlom a ComfyUI használatát. Ez egy vizuális, csomópont-alapú alkalmazás, amely elsőre kissé ijesztőnek tűnhet, de meglepően könnyen megszokható. Ne feledje, hogy a Stability Matrix több frontendet is képes kezelni, így nem kell egyre szorítkoznia. Kísérletezhet, és megtalálhatja az Önnek legmegfelelőbbet.

Használja a fenti listát, és navigáljon az egyes csomagok GitHub oldalaira. Szánjon időt, és ismerkedjen meg az egyes csomagokkal, mielőtt döntést hozna.

Ennek az útmutatónak a céljaira végigvezetem a ComfyUI letöltésén és telepítésén, valamint néhány hasznos bővítményen, amelyek jó szolgálatot tehetnek.

A ComfyUI telepítése és beállítása

Nyissa meg a Stability Matrixot, és kattintson a "Csomag hozzáadása" gombra. Most keresse meg a "ComfyUI"-t a felkínált csomagok listáján, és kattintson rá. A megnyíló oldalon győződjön meg róla, hogy a legördülő mezőben a "master" van kiválasztva. A "master" verzió a legstabilabb kiadás, és a legtöbb felhasználó számára ajánlott.

A ComfyUI hub képernyőkép a Stability Matrix telepítéshez, piros színnel kiemelve a build select legördülő menüpontot. (Kép forrása: Windows Screen Capture)
Győződjön meg róla, hogy a legördülő menüben a master van kiválasztva. (Kép forrása: Windows Screen Capture)

A Telepítés gombra kattintva a Stability Matrix elkezdi letölteni a csomagot. Csak várjon, amíg befejeződik. A letöltés eltarthat néhány percig, így nyugodtan használhatja tovább a rendszerét ez idő alatt. Ha a letöltési mező bezárul, vagy véletlenül a "Elrejtés" gombot nyomja meg, az alján található Letöltés gomb segítségével megtekintheti az aktuális letöltés állapotát.

A Stabilitásmátrix felületének képernyőképét a letöltés gomb piros kiemelésével. (Kép forrása: Windows Screen Capture)
A folyamatban lévő letöltéseket erre a gombra kattintva ellenőrizheti. (Kép forrása: Windows Screen Capture)

A telepítés után egy felugró értesítést kell látnia a tálcán, amely arról tájékoztatja, hogy a ComfyUI készen áll a használatra.

Menj vissza a Csomagok oldalra, és látni fogod a ComfyUI csempét az oldalon, de még ne indítsd el. A ComfyUI alapértelmezés szerint normál VRAM módban indul a 12 GB vagy nagyobb VRAM-mal rendelkező GPU-k esetében. Ha 8 GB VRAM-os kártyával rendelkezik, akkor most itt az ideje, hogy rákényszerítse a Comfy-t, hogy alacsony VRAM módban induljon el.

A Stability Matrix csomagközpontjának képernyőképét a ComfyUI csempén pirossal kiemelt beállításokkal. (Kép forrása: Windows Screen Capture)
Kattintson a beállítások ikonra. (Kép forrása: Windows képernyőfelvétel)

Kattintson a középen található beállítások fogaskerékre, és görgessen lefelé a VRAM szakaszhoz. Válassza ki a "--lowvram" opciót, és nyomja meg a Mentés gombot.

Képernyőkép a ComfyUI csempén belüli beállítások menüjéről a Stabilitás mátrixon, az alacsony vram kiemelve. (Kép forrása: Windows Screen Capture)
Válassza ki a "--lowvram" opciót, és nyomja meg a Mentés gombot. (Kép forrása: Windows Screen Capture)

Ezután telepítenünk kell a ComfyUI Manager-t. Ez egy kritikus fontosságú komponens, amely lehetővé teszi a különböző egyéni csomópontok telepítését és kezelését az alkalmazáson belül. Kattintson a jobb oldali Jigsaw ikonra, és írja be a "ComfyUI-Manager" szót az "Elérhető bővítmények" részbe. Válassza ki, és kattintson a Telepítés gombra az alján. Miután befejezte a telepítést, látnia kell mellette a "(telepítve)" szöveget. Most már készen állunk a ComfyUI elindítására.

Képernyőkép, amely kiemeli a kirakós ikonját a ComfyUI csempén a Stabilitásmátrixon. (Kép forrása: Windows Screen Capture)
Kattintson a kirakós ikonra a bővítmények menü megjelenítéséhez. (Kép forrása: Windows képernyőfelvétel)
A ComfyUI elérhető bővítmények menüjének képernyőképét a Stabilitásmátrixban. (Kép forrása: Windows Screen Capture)
Válassza ki a ComfyUI-Managert, és nyomja meg a Telepítés gombot. (Kép forrása: Windows Screen Capture)

Indítsa el a ComfyUI-t, és hagyja, hogy végigfusson az indítási folyamaton. Ha ez megtörtént, automatikusan megnyílik egy új fülön az alapértelmezett böngészőjében. Ha nem nyílik meg, menjen vissza a Csomagok fülre, és kattintson a WebUI-ra a most már zöld színű ComfyUI csempén.

Képernyőkép a zöld ComfyUI csempéről a Stabilitási mátrixban, a WebUI opció piros színnel kiemelve. (Kép forrása: Windows Screen Capture)
Kattintson a WebUI gombra a ComfyUI felületének megnyitásához az alapértelmezett böngészőben. (Kép forrása: Windows képernyőfelvétel)

Gratulálunk! Most már minden előfeltételt teljesítettél. Most pedig térjünk rá a lényegre, a képmodellek letöltésére és használatára.

Az első képmodell letöltése és használata

Mielőtt elkezdenénk a képmodellek letöltését, nézzük át a fogalmakat, amelyeket ismernie kell.

1) UNET/Checkpoint/Diffúziós modell/Diffusers - A nagyfőnök. A művelet agya, gondolj rá úgy, mint a művészre, aki a te szavaiddal fest.

2) Tokenizer - Az időmérő. Ők alakítják át az Ön felszólításait tokenekké a beágyazáshoz, mielőtt a szövegkódolók átveszik az irányítást. A modelltől függően meghatározott számú tokenre (szóra) van korlátozva, amit használhatsz.

3) Szövegkódolók/CLIP - A nehézgépek. Ők alakítják át a szöveges felszólításokat olyan digitális bemenetekké, amelyeket az UNET meg tud érteni.

4) Mintavevők - A fő karmester. Iteratív módon irányítja a képgenerálási folyamatot, a képet a zajtól a végső kimenetig finomítva.

5) VAE - A tisztító személyzet. A generálási szakasz után megtisztítják a zajtól, és segítenek a képminőség javításában.

Most, az út során még több kifejezéssel fog találkozni, de ezek az alapok, amelyek innentől kezdve mindent meghatároznak. Ne aggódjon túlságosan, hogy egyelőre nem kell részletesen foglalkoznia velük.

A ComfyUI munkafolyamat menüjének képernyőképét a Sablonok böngészése kiemelve. (Kép forrása: Windows Screen Capture)
Válassza a Sablonok böngészése lehetőséget. (Kép forrása: Windows Screen Capture)

Indítsa el a ComfyUI-t, és egy tiszta munkafolyamat ablakot kell megnyitnia. Kattintson a bal felső sarokban a "Munkafolyamat", majd a "Sablonok böngészése" lehetőségre

A ComfyUI munkafolyamat központjának képernyőképét az Alapok és a Képgenerálás kiemelve. (Kép forrása: Windows Screen Capture)
Kattintson az Alapok, majd a Képgenerálás menüpontra. (Kép forrása: Windows Screen Capture)

Ekkor megnyílik egy ablak, amely már beállított példamunkafolyamatokat tartalmaz. Kattintson az "Alapok", majd a "Képgenerálás" menüpontra A képernyőn azonnal megjelenik egy hibaüzenet, amely a hiányzó modellekről tájékoztatja Önt. Ez azért van, mert valójában még nem töltöttünk le képmodellt. Menjünk tovább, és tegyük meg ezt. Kattintsunk a letöltésre.

A ComfyUI hiba menüjének képernyőképét a Letöltés gomb kiemelésével. (Kép forrása: Windows Screen Capture)
Töltse le a hiányzó ellenőrzőpontot. (Kép forrása: Windows Screen Capture)

Amíg a fájl letöltődik, térjünk ki néhány különbségre a különböző modellek között, amelyeket látni fogsz. Amit most letöltünk, az a Stable Diffusion 1.5 alapmodell. A ComfyUI vásznán észrevehetted, hogy a legelső "Load Checkpoint" csomóponttól három különálló kapcsolat van. Egy-egy a MODELL, a CLIP és a VAE számára.

Közelkép a ComfyUI Load Checkpoint csomópontjáról. (Kép forrása: Windows Screen Capture)
A Load Checkpoint mindhárom kimenete a munkafolyamat egy-egy csomópontjához kapcsolódik. (Kép forrása: Windows képernyőfelvétel)

Ez azért van így, mert mindhárom benne van ebben az alap ellenőrzőpontban, és ehhez a modellhez nem kell külön CLIP-et és VAE-t használni.

Az újabb képmodellek azonban, mint például a Flux vagy a HiDream, külön kell letöltened őket, ezért ezt tartsd szem előtt. Szerencsére ezekhez is vannak példasablonok, mint ez, így nem kell aggódnia, hogy mindent beállítson. Erről majd később beszélünk. Most pedig generáljuk az első képünket.

Most, ha a jobb alsó sarokban lévő Futtatás gombra kattintunk, észrevehetjük, hogy a ComfyUI még mindig hibát ad. Ez azért van, mert a modellnek a megfelelő mappába kell kerülnie ahhoz, hogy a Comfy felismerje. Most menjen a File Explorerben abba a mappába, ahonnan letöltötte a modellt, és másolja be.

Észre fogja venni, hogy a fájlnévnek ".SAFETENSORS," kiterjesztése van. Ezt a formátumot használja a fájl. Általános szabályként csak .safetensors kiterjesztésű fájlokat töltsön le. Ne töltsön le pickle tensorokat vagy .pth kiterjesztésűeket. Bízz bennem!

Nyissa meg a mappát, ahová a Stability Matrixot telepítette, és keressen egy "Models" nevű mappát Kattintson rá duplán, és keressen egy "StableDiffusion" nevű almappát, majd illessze bele a .safetensors fájlt.

A jövőre nézve. A CLIPS-t és VAE-t tartalmazó modelleket a "StableDiffusion" mappába kell helyezni. A csak az UNET-et tartalmazó modelleket (CLIP és VAE nélkül) a "DiffusionModels" mappába kell helyezni. A szövegkódolókat (T5, Llama, CLIP L, CLIP G) a "TextEncoders" mappába kell elhelyezni. Végül a VAE fájlok a "VAE" mappába kerülnek.

Mint valószínűleg láthatod, sokkal több mappa van, mint ez a három. Azt tanácsolnám, hogy találd ki, ha eljutsz hozzájuk. Egyelőre foglalkozzunk a képünkkel.

Közelkép a ComfyUI Load Checkpoint legördülő menüjéről. (Kép forrása: Windows Screen Capture)
Válassza ki a "v1-5-pruned-emaonly-fp16" opciót a legördülő menüben. (Kép forrása: Windows Screen Capture)

Frissítse a ComfyUI weboldalát a böngészőjében. Kattintson a párbeszédpanel "Ellenőrző pont betöltése" csomópontjára, és válassza ki a letöltött fájlt.

Mivel ez egy sablon, már minden be van állítva az Ön számára. Érdemes azonban ismernie az alapvető alapokat a jövőbeli munkafolyamataihoz. Kezdjük a bal oldalon. A Load Checkpoint csomópontot már tárgyaltuk, mellette pedig két "CLIP Text Encode (Prompt)" csomópont található.

A legfelső a pozitív promptok, vagyis az, amit a képen látni szeretne. Alul van a negatív promptok bemenete, vagy amit nem akar látni a végső kimeneten. A képek generálása e két csomópont kombinált egyensúlya. Létrehoz egy képet, ellenőrzi, hogy mi nem tetszik benne, és ezt beírja a negatív promptba. Egyelőre ezek már be vannak írva számunkra, ezért kattintsunk a "Futtatás" gombra

A ComfyUI egy vizuális felület, ami azt jelenti, hogy valóban láthatjuk, ahogy a folyamat csomópontról csomópontra történik. Amint a szövegünk kódolva van, elküldjük a "KSampler"-nek, amely elkezdi a kép iterálását. Nézzük át gyorsan az összes beállítást ebben a csomópontban.

1) Seed: Gondolj rá úgy, mint a kép címére. Ugyanaz a pozitív prompt + negatív prompt + ugyanazok a beállítások + ugyanaz a mag = ugyanaz a kép. Hasznos egy kép újbóli létrehozásához és iterálásához.

2) Ellenőrzés a generálás után: Meghatározza, hogy a mag minden generálás után véletlenszerűvé válik-e, vagy fix maradjon.

3) Lépések: A lépések száma, amelyeken a KSampler iteráljon. A legtöbb modell ajánlott lépésekkel érkezik.

4) CFG: A modell reakciókészsége a felszólításra. Nagyobb értékek = szigorúan betartja a promptokat, de kevésbé kreatív. Alacsonyabb értékek = kreatívabb kimenetek a promptok betartásának árán.

5) Sampler_name: a jelenleg használt mintavevő neve. Kattintson a legördülő listára a további lehetőségekért. Kísérletezzen különböző beállításokkal és mintavevőkkel a változatos kimenetek érdekében.

6) Scheduler (ütemező): Gondoljon rá úgy, mint a másodhegedűsre, aki olyan stratégiákat talál ki, amelyeket a karmester jóváhagy. Ismét kísérletezzen különböző mintavételezőkkel és ütemezőkkel, hogy megtalálja az ön számára megfelelőt.

7) Denoise: Meghatározza a generálási folyamat elejére hozzáadott zaj mennyiségét. Ezt a mintavevő iteratív módon távolítja el. Az értéket nem lehet 1,00 fölé állítani, az ennél alacsonyabb értékeket (0,45 vagy 0,65) elsősorban a kép-kép, finomító vagy festés utáni munkafolyamatokban használják.

Közelkép a KSampler csomópontról a ComfyUI-ban. (Kép forrása: Windows Screen Capture)
A KSampler "latent_image" kimenete a munkafolyamat "Empty Latent Image" csomópontjához kapcsolódik. (Kép forrása: Windows képernyőfelvétel)
Az Empty Latent Image csomópont képernyőképét a ComfyUI-ban. (Kép forrása: Windows Screen Capture)
Az Üres látens kép határozza meg a végső kimenet méretét. (Kép forrása: Windows Screen Capture)

A KSampler csomópont bal oldalán található latent_image bemenet határozza meg a kép méretét. A munkafolyamatban egy "Empty Latent Image" csomóponthoz van csatlakoztatva, amelynek felbontása 512x512 és a kötegméret (az egy futtatás során generált képek száma) 1.

Egy példakép egy mesterséges intelligencia által generált palackról, benne egy galaxissal, amelyet egy egyszerű faasztalon tartanak. (Kép forrása: AI Generated)
Az első képünk a generációs beállítások használatával. (Kép forrása: AI Generated)

Na, ezt nézd meg! A legelső képünk. Ha idáig eljutottál, gratulálunk! Most már ismered az alapokat, hogy elindulhass a képgenerálás útján. Minél többet kísérletezel, annál többet fogsz felfedezni, és ez a nyúl ürege mélyre nyúlik. Úgyhogy érezd jól magad.

Hasznos linkek

CivitAI: Az Ön egyablakos boltja modellek, LoRA-k, beágyazások és sok más letöltéséhez. (Vigyázat: NSFW tartalmakat tartalmaz. Használja a beépített oldalszűrőket.)

Monzon Media: Fantasztikus forrás a kezdő és haladó ComfyUI oktatóanyagokhoz.

ComfyUI Wiki: Minden hibaelhárítási igénye esetén.

Bad ASS ComfyUI erőforrás lista: Linkek az összes Bázismodellhez, CLIP-hez és VAE-hez, amire szükséged lehet, egy helyen.

Comfy munkafolyamatok: Egy dedikált közösség a munkafolyamatok megosztására és letöltésére.

Please share our article, every link counts!
Mail Logo
> Magyarország - Kezdőlap > Newsarchive 2025 07 > Útmutató: Így generálhatsz képeket a számítógépeden ingyenesen
Rohith Bhaskar, 2025-07- 9 (Update: 2025-07- 9)