PuLID: ingyenes képek generálása a saját konzisztens arcunkkal. ComfyUI használata a saját gépünkön
A PuLID lehetővé teszi a felhasználók számára, hogy a szöveg-alapú képgeneráló modelleket a saját személyazonosságukhoz igazítsák anélkül, hogy finomhangolásra lenne szükség.
A CLIP, amely a "Contrastive Language–Image Pre-training" kifejezés rövidítése, egy gépi tanulási modell, amelyet az OpenAI fejlesztett ki. A CLIP modell kifejezetten arra lett tervezve, hogy a szöveges leírásokat és a képeket összekapcsolja, ezáltal képes megérteni és értékelni, hogy egy kép mennyire felel meg egy adott szöveges leírásnak.
A diffúziós képgenerálás során a CLIP modellt gyakran használják azért, hogy irányítsa és finomítsa a generálási folyamatot. Működésének alapja, hogy a modell összehasonlítja a generált képeket a célként megadott szöveges leírással, és azokat a változatokat részesíti előnyben, amelyek a leíráshoz a legjobban illeszkednek. Ez a megközelítés lehetővé teszi, hogy a képgenerálás sokkal relevánsabb és pontosabb legyen a kívánt témára vonatkozóan.
Tehát röviden, a CLIP azáltal javítja a diffúziós képgenerálási folyamatokat, hogy értelmezi a szöveges leírásokat és útmutatást ad a képeknek, hogy azok mennyire felelnek meg ezeknek a leírásoknak. Ez különösen hasznos olyan bonyolultabb vagy absztraktabb képi kéréseknél, ahol fontos a szöveg és kép közötti pontos összhang.
Az EVA-CLIP egy fejlett kép-generálási modell, amely a CLIP (Contrastive Language-Image Pre-training) technológiát használja. A CLIP modellek képesek szöveg és kép közötti kapcsolatok tanulására, ami lehetővé teszi számukra, hogy szöveges leírások alapján képeket generáljanak. Az EVA-CLIP továbbfejlesztett változata, amely új technikákat alkalmaz a hatékonyabb és stabilabb képzés érdekében. Itt van néhány kulcsfontosságú előnye:
Hatékonyság: Az EVA-CLIP csökkenti a képzési költségeket és növeli a hatékonyságot.
Stabilitás: Az új technikák stabilizálják a nagy méretű CLIP modellek képzését.
Magas Teljesítmény: Az EVA-CLIP jobb teljesítményt nyújt a zero-shot feladatokban, mint a korábbi CLIP modellek.
Nyílt Hozzáférés: Az EVA-CLIP modellcsaládot nyíltan hozzáférhetővé tették a kutatási közösség számára
SDXL: 20 sec
SDXL 4 step lightning: 3,5 sec
SDXL 4 step lightning lora: 4,4 sec
*** Telepítés ***
git clone https://github.com/cubiq/PuLID_ComfyUI.git
pip install -r requirements.txt
pip install timm
pip install ftfy
*** Linkek ***
ComfyUI videók: https://www.youtube.com/@Mp3Pintyo/search?query=comfyui
Twitter Matteo: https://twitter.com/cubiq/status/1788212175846150493
GitHub PuLID ComfyUI: https://github.com/cubiq/PuLID_ComfyUI
EVA-CLIP: https://arxiv.org/pdf/2303.15389
SDXL Lightning modellek Hugging Face: https://huggingface.co/ByteDance/SDXL-Lightning/tree/main
* Legyél Te is Tagja az Mp3Pintyo csatornának *
https://www.youtube.com/channel/UC-3YkVvPQbZiApqrRXEOaPg/join
*** DISCORD***
Mp3Pintyo szerver: https://discord.gg/NBgUuVDURG
*** Támogatás ***
Patreon: https://www.patreon.com/mp3pintyo
*** BUYING MY ARTS ***
► https://www.etsy.com/shop/mp3pintyo
► https://stock.adobe.com/contributor/211260791/zsolt
*** STAY ACTIVE FOR A FOLLOW ***
►TWITTER: https://twitter.com/Mp3Pintyo
►INSTAGRAM: https://www.instagram.com/mp3pintyo/
►PINTEREST: https://www.pinterest.com/mp3pintyo/
►SOUNDCLOUD: https://soundcloud.com/mp3pintyo