
Útmutató: Így generálhatsz képeket a számítógépeden ingyenesen
CheckMag
Szeretne képeket készíteni számítógépén anélkül, hogy felhőszolgáltatásokra támaszkodna? Ez az útmutató végigvezeti az ingyenes, nyílt forráskódú eszközök beállításán, amelyekkel előfizetés nélkül, teljes kreatív irányítást kaphat.Rohith Bhaskar, ✓ Rohith Bhaskar (fordította Ninh Duy) Közzétett 🇺🇸 🇵🇱 ...
A képgeneráló eszközök egyre inkább képesek a legkorszerűbb fotórealisztikus képek létrehozására. Sajnos a legtöbbjüket online, fizetős fal mögé zárták, de mi lenne, ha azt mondanám, hogy van mód arra, hogy ezeket helyben futtassuk, sokkal nagyobb rugalmassággal, mint amit az online eszközök nyújtanak?
Előfeltételek
1) Egy Nvidia grafikus kártya legalább 8 GB VRAM-mal. (RTX 3060 vagy jobb ajánlott )
2) Minimum 16GB DDR4 rendszermemória. (Minél több van, annál jobb )
3) Windows 10/11 (64 bites operációs rendszer szükséges )
4) Legalább 100-150 GB szabad merevlemezterület az összes beállításához és a modellek letöltéséhez.
5) Internetkapcsolat a kezdeti beállításokhoz. (Csak az UI frontendek és a képmodellek letöltéséhez és telepítéséhez szükséges )
Megjegyzés: Az AMD vagy Intel GPU-kat a legtöbb UI frontend hivatalosan nem támogatja, és a működésükhöz workaroundsra van szükség.
Az első dolog, amit meg kell tennie, hogy biztosítsa, hogy a grafikus kártyájához az Nvidia legújabb stúdió-illesztőprogramjait használja. Ha nem vagy biztos abban, hogy milyen Nvidia GPU-t telepítettél, kattints a jobb gombbal bárhol az asztalon, és a kontextusmenüben kattints az "NVIDIA Control Panel" menüpontra.
A megnyíló oldal legalsó részén keresse meg a "Rendszerinformáció" lehetőséget. A bal oldalon a grafikus kártyád nevét kell látnod, szükség esetén további információkkal együtt.
» A Top 10 multimédiás noteszgép - tesztek alapján
» A Top 10 játékos noteszgép
» A Top 10 belépő szintű üzleti noteszgép
» A Top 10 üzleti noteszgép
» A Top 10 notebook munkaállomása
» A Top 10 okostelefon - tesztek alapján
» A Top 10 táblagép
» A Top 10 Windows tabletje
» A Top 10 subnotebook - tesztek alapján
» A Top 10 300 euró alatti okostelefonja
» A Top 10 120 euró alatti okostelefonja
» A Top 10 phabletje (>5.5-inch)
» A Top 10 noteszgép 500 EUR (~160.000 HUF) alatt
» A Top 10 "pehelysúlyú" gaming notebookja
Nyissa meg az Nvidia hivatalos illesztőprogram-tárat itt, keresse meg az Nvidia Studio illesztőprogramokat, és kattintson a Letöltés gombra. Ez megnyit egy oldalt, ahonnan letöltheti a legújabb illesztőprogramot. Most érdemes ellenőrizni, hogy az Ön Nvidia termékét támogatja-e az illesztőprogram. Ezt megteheti a "Támogatott termékek" gombra kattintva, közvetlenül a letöltés gomb alatt. Telepítse az illesztőprogramokat és indítsa újra a számítógépét.
Megjegyzés: Ez felülírja a Game Ready Drivers-t, ha már telepítetted őket. Ha a rendszerét elsősorban játékra használja, előfordulhat, hogy a játékokban csökken a teljesítménye.
Nagyszerű! Az első lépés már megtörtént. Most már áttérhetünk a szórakoztató dolgokra, mint például a felhasználói felület frontendek letöltése. Nagyon ajánlom a Stability Matrix letöltését és telepítését. Ez egy minden egyben karbantartó eszköz, amely több UI frontendet támogat, és automatikusan naprakészen tartja őket. Még megosztott mappákat is létrehoz a modellek és kimenetek számára, amelyeket egy helyen tekinthet meg.
A GitHub oldalon, görgessen le a readme részhez, és keresse meg az operációs rendszerét. A Stability Matrix Linuxra és Macre is kínál letöltést. Ebben az útmutatóban a Windows verziót fogjuk használni.
Kattintson az operációs rendszer gombra, és a program a oldalon egy .zip fájl letöltését kéri. Ezt arra a meghajtóra kell helyezni, ahová a Stability Matrixot telepíteni szeretné. Győződjön meg róla, hogy a meghajtón legalább 100-150 GB szabad hely van. Ez nem csak a Stability Matrix telepítéséhez szükséges, hanem a szükséges modellek, szövegkódolók és egyéb rendszerfájlok letöltéséhez is. Ezek elég gyorsan összeadódnak.
Miután letöltötte a fájlt, csomagolja ki, és futtassa a kicsomagolt mappában található StabilityMatrix.exe programot. Ennek automatikusan le kell töltenie az összes szükséges fájlt, és be kell állítania a felületet.
Félelmetes! Most már van egy felületünk több UI frontend letöltéséhez és telepítéséhez.
Most itt az ideje, hogy eldöntsük, melyik frontendet szeretnénk használni. A frontend egy grafikus felhasználói felület (GUI), amely lehetővé teszi a képmodellekkel való interakciót, a beállítások kezelését, és ami még fontosabb, a képek generálását.
Íme egy gyors lista a Stability Matrixon kínált lehetőségekről.
1) Stabil Diffúzió WebUI kovácsolás
2) Stable Diffusion WebUI Forge - Klasszikus
4) Foooocus
5) Fooocus - mashb1t's 1-Up Edition
7) SwarmUI
8) Cogstudio
10) RuinedFooocus
11) SD.Next
12) SDFX
13) InvokeAI
Én személy szerint nagyon ajánlom a ComfyUI használatát. Ez egy vizuális, csomópont-alapú alkalmazás, amely elsőre kissé ijesztőnek tűnhet, de meglepően könnyen megszokható. Ne feledje, hogy a Stability Matrix több frontendet is képes kezelni, így nem kell egyre szorítkoznia. Kísérletezhet, és megtalálhatja az Önnek legmegfelelőbbet.
Használja a fenti listát, és navigáljon az egyes csomagok GitHub oldalaira. Szánjon időt, és ismerkedjen meg az egyes csomagokkal, mielőtt döntést hozna.
Ennek az útmutatónak a céljaira végigvezetem a ComfyUI letöltésén és telepítésén, valamint néhány hasznos bővítményen, amelyek jó szolgálatot tehetnek.
A ComfyUI telepítése és beállítása
Nyissa meg a Stability Matrixot, és kattintson a "Csomag hozzáadása" gombra. Most keresse meg a "ComfyUI"-t a felkínált csomagok listáján, és kattintson rá. A megnyíló oldalon győződjön meg róla, hogy a legördülő mezőben a "master" van kiválasztva. A "master" verzió a legstabilabb kiadás, és a legtöbb felhasználó számára ajánlott.
A Telepítés gombra kattintva a Stability Matrix elkezdi letölteni a csomagot. Csak várjon, amíg befejeződik. A letöltés eltarthat néhány percig, így nyugodtan használhatja tovább a rendszerét ez idő alatt. Ha a letöltési mező bezárul, vagy véletlenül a "Elrejtés" gombot nyomja meg, az alján található Letöltés gomb segítségével megtekintheti az aktuális letöltés állapotát.
A telepítés után egy felugró értesítést kell látnia a tálcán, amely arról tájékoztatja, hogy a ComfyUI készen áll a használatra.
Menj vissza a Csomagok oldalra, és látni fogod a ComfyUI csempét az oldalon, de még ne indítsd el. A ComfyUI alapértelmezés szerint normál VRAM módban indul a 12 GB vagy nagyobb VRAM-mal rendelkező GPU-k esetében. Ha 8 GB VRAM-os kártyával rendelkezik, akkor most itt az ideje, hogy rákényszerítse a Comfy-t, hogy alacsony VRAM módban induljon el.
Ezután telepítenünk kell a ComfyUI Manager-t. Ez egy kritikus fontosságú komponens, amely lehetővé teszi a különböző egyéni csomópontok telepítését és kezelését az alkalmazáson belül. Kattintson a jobb oldali Jigsaw ikonra, és írja be a "ComfyUI-Manager" szót az "Elérhető bővítmények" részbe. Válassza ki, és kattintson a Telepítés gombra az alján. Miután befejezte a telepítést, látnia kell mellette a "(telepítve)" szöveget. Most már készen állunk a ComfyUI elindítására.
Indítsa el a ComfyUI-t, és hagyja, hogy végigfusson az indítási folyamaton. Ha ez megtörtént, automatikusan megnyílik egy új fülön az alapértelmezett böngészőjében. Ha nem nyílik meg, menjen vissza a Csomagok fülre, és kattintson a WebUI-ra a most már zöld színű ComfyUI csempén.
Gratulálunk! Most már minden előfeltételt teljesítettél. Most pedig térjünk rá a lényegre, a képmodellek letöltésére és használatára.
Az első képmodell letöltése és használata
Mielőtt elkezdenénk a képmodellek letöltését, nézzük át a fogalmakat, amelyeket ismernie kell.
1) UNET/Checkpoint/Diffúziós modell/Diffusers - A nagyfőnök. A művelet agya, gondolj rá úgy, mint a művészre, aki a te szavaiddal fest.
2) Tokenizer - Az időmérő. Ők alakítják át az Ön felszólításait tokenekké a beágyazáshoz, mielőtt a szövegkódolók átveszik az irányítást. A modelltől függően meghatározott számú tokenre (szóra) van korlátozva, amit használhatsz.
3) Szövegkódolók/CLIP - A nehézgépek. Ők alakítják át a szöveges felszólításokat olyan digitális bemenetekké, amelyeket az UNET meg tud érteni.
4) Mintavevők - A fő karmester. Iteratív módon irányítja a képgenerálási folyamatot, a képet a zajtól a végső kimenetig finomítva.
5) VAE - A tisztító személyzet. A generálási szakasz után megtisztítják a zajtól, és segítenek a képminőség javításában.
Most, az út során még több kifejezéssel fog találkozni, de ezek az alapok, amelyek innentől kezdve mindent meghatároznak. Ne aggódjon túlságosan, hogy egyelőre nem kell részletesen foglalkoznia velük.
Ekkor megnyílik egy ablak, amely már beállított példamunkafolyamatokat tartalmaz. Kattintson az "Alapok", majd a "Képgenerálás" menüpontra A képernyőn azonnal megjelenik egy hibaüzenet, amely a hiányzó modellekről tájékoztatja Önt. Ez azért van, mert valójában még nem töltöttünk le képmodellt. Menjünk tovább, és tegyük meg ezt. Kattintsunk a letöltésre.
Amíg a fájl letöltődik, térjünk ki néhány különbségre a különböző modellek között, amelyeket látni fogsz. Amit most letöltünk, az a Stable Diffusion 1.5 alapmodell. A ComfyUI vásznán észrevehetted, hogy a legelső "Load Checkpoint" csomóponttól három különálló kapcsolat van. Egy-egy a MODELL, a CLIP és a VAE számára.
Ez azért van így, mert mindhárom benne van ebben az alap ellenőrzőpontban, és ehhez a modellhez nem kell külön CLIP-et és VAE-t használni.
Az újabb képmodellek azonban, mint például a Flux vagy a HiDream, külön kell letöltened őket, ezért ezt tartsd szem előtt. Szerencsére ezekhez is vannak példasablonok, mint ez, így nem kell aggódnia, hogy mindent beállítson. Erről majd később beszélünk. Most pedig generáljuk az első képünket.
Most, ha a jobb alsó sarokban lévő Futtatás gombra kattintunk, észrevehetjük, hogy a ComfyUI még mindig hibát ad. Ez azért van, mert a modellnek a megfelelő mappába kell kerülnie ahhoz, hogy a Comfy felismerje. Most menjen a File Explorerben abba a mappába, ahonnan letöltötte a modellt, és másolja be.
Észre fogja venni, hogy a fájlnévnek ".SAFETENSORS," kiterjesztése van. Ezt a formátumot használja a fájl. Általános szabályként csak .safetensors kiterjesztésű fájlokat töltsön le. Ne töltsön le pickle tensorokat vagy .pth kiterjesztésűeket. Bízz bennem!
Nyissa meg a mappát, ahová a Stability Matrixot telepítette, és keressen egy "Models" nevű mappát Kattintson rá duplán, és keressen egy "StableDiffusion" nevű almappát, majd illessze bele a .safetensors fájlt.
A jövőre nézve. A CLIPS-t és VAE-t tartalmazó modelleket a "StableDiffusion" mappába kell helyezni. A csak az UNET-et tartalmazó modelleket (CLIP és VAE nélkül) a "DiffusionModels" mappába kell helyezni. A szövegkódolókat (T5, Llama, CLIP L, CLIP G) a "TextEncoders" mappába kell elhelyezni. Végül a VAE fájlok a "VAE" mappába kerülnek.
Mint valószínűleg láthatod, sokkal több mappa van, mint ez a három. Azt tanácsolnám, hogy találd ki, ha eljutsz hozzájuk. Egyelőre foglalkozzunk a képünkkel.
Frissítse a ComfyUI weboldalát a böngészőjében. Kattintson a párbeszédpanel "Ellenőrző pont betöltése" csomópontjára, és válassza ki a letöltött fájlt.
Mivel ez egy sablon, már minden be van állítva az Ön számára. Érdemes azonban ismernie az alapvető alapokat a jövőbeli munkafolyamataihoz. Kezdjük a bal oldalon. A Load Checkpoint csomópontot már tárgyaltuk, mellette pedig két "CLIP Text Encode (Prompt)" csomópont található.
A legfelső a pozitív promptok, vagyis az, amit a képen látni szeretne. Alul van a negatív promptok bemenete, vagy amit nem akar látni a végső kimeneten. A képek generálása e két csomópont kombinált egyensúlya. Létrehoz egy képet, ellenőrzi, hogy mi nem tetszik benne, és ezt beírja a negatív promptba. Egyelőre ezek már be vannak írva számunkra, ezért kattintsunk a "Futtatás" gombra
A ComfyUI egy vizuális felület, ami azt jelenti, hogy valóban láthatjuk, ahogy a folyamat csomópontról csomópontra történik. Amint a szövegünk kódolva van, elküldjük a "KSampler"-nek, amely elkezdi a kép iterálását. Nézzük át gyorsan az összes beállítást ebben a csomópontban.
1) Seed: Gondolj rá úgy, mint a kép címére. Ugyanaz a pozitív prompt + negatív prompt + ugyanazok a beállítások + ugyanaz a mag = ugyanaz a kép. Hasznos egy kép újbóli létrehozásához és iterálásához.
2) Ellenőrzés a generálás után: Meghatározza, hogy a mag minden generálás után véletlenszerűvé válik-e, vagy fix maradjon.
3) Lépések: A lépések száma, amelyeken a KSampler iteráljon. A legtöbb modell ajánlott lépésekkel érkezik.
4) CFG: A modell reakciókészsége a felszólításra. Nagyobb értékek = szigorúan betartja a promptokat, de kevésbé kreatív. Alacsonyabb értékek = kreatívabb kimenetek a promptok betartásának árán.
5) Sampler_name: a jelenleg használt mintavevő neve. Kattintson a legördülő listára a további lehetőségekért. Kísérletezzen különböző beállításokkal és mintavevőkkel a változatos kimenetek érdekében.
6) Scheduler (ütemező): Gondoljon rá úgy, mint a másodhegedűsre, aki olyan stratégiákat talál ki, amelyeket a karmester jóváhagy. Ismét kísérletezzen különböző mintavételezőkkel és ütemezőkkel, hogy megtalálja az ön számára megfelelőt.
7) Denoise: Meghatározza a generálási folyamat elejére hozzáadott zaj mennyiségét. Ezt a mintavevő iteratív módon távolítja el. Az értéket nem lehet 1,00 fölé állítani, az ennél alacsonyabb értékeket (0,45 vagy 0,65) elsősorban a kép-kép, finomító vagy festés utáni munkafolyamatokban használják.
A KSampler csomópont bal oldalán található latent_image bemenet határozza meg a kép méretét. A munkafolyamatban egy "Empty Latent Image" csomóponthoz van csatlakoztatva, amelynek felbontása 512x512 és a kötegméret (az egy futtatás során generált képek száma) 1.
Na, ezt nézd meg! A legelső képünk. Ha idáig eljutottál, gratulálunk! Most már ismered az alapokat, hogy elindulhass a képgenerálás útján. Minél többet kísérletezel, annál többet fogsz felfedezni, és ez a nyúl ürege mélyre nyúlik. Úgyhogy érezd jól magad.
Hasznos linkek
CivitAI: Az Ön egyablakos boltja modellek, LoRA-k, beágyazások és sok más letöltéséhez. (Vigyázat: NSFW tartalmakat tartalmaz. Használja a beépített oldalszűrőket.)
Monzon Media: Fantasztikus forrás a kezdő és haladó ComfyUI oktatóanyagokhoz.
ComfyUI Wiki: Minden hibaelhárítási igénye esetén.
Bad ASS ComfyUI erőforrás lista: Linkek az összes Bázismodellhez, CLIP-hez és VAE-hez, amire szükséged lehet, egy helyen.
Comfy munkafolyamatok: Egy dedikált közösség a munkafolyamatok megosztására és letöltésére.