HiDiffusion: akár 4096x4096 pixel felbontású képek generálása a saját gépünkön bármelyik SD modellel

Channel:
Subscribers:
3,300
Published on ● Video Link: https://www.youtube.com/watch?v=gPP0PJqgPxg



Duration: 32:51
293 views
12


Nincs szükség képzésre, és csak egy sor kód szükséges az SD-vel generált képek felbontásának és sebességének javításához.
Támogatja a képgenerálás felbontásának 4096×4096-ra növelését, miközben a képgenerálás sebességét 1,5-6-szorosára növeli.
Támogatja az összes SD-modellt, és támogatja az SD-modellek későbbi modelljeit is, mint például a Playground.

Részletes bemutató:
A kutatási anyag a "HiDiffusion" nevű technológia fejlesztését és hatékonyságát mutatja be, ami a diffúziós modellek képalkotási teljesítményét hivatott javítani nagy felbontású képek generálására. A diffúziós modellek alapvetően arra használatosak, hogy adott bemeneti adatok (például szöveges leírások) alapján képeket hozzanak létre. Ezek a modellek viszont korábban korlátozottak voltak a nagyobb felbontású képek gyors és hatékony előállítására.
Mi a probléma a meglévő modellekkel?

A nagy felbontású képek közvetlen generálása a modellekkel problémás lehet, mert az objektumok megkettőződhetnek, és az időigény is jelentősen megnőhet. Ennek két fő oka van:

Objektum megkettőződése: Ez a jelenség a U-Net architektúrában található mély rétegekben megismétlődő jellemzők miatt következik be.
Hatékonysági problémák: Ahogy a képfelbontás növekszik, a generálás ideje exponenciálisan nő, ami a modellek alkalmazhatóságát korlátozza.

Hogyan javítja a HiDiffusion ezeket a problémákat?

A HiDiffusion két fő komponensből áll:

Resolution-Aware U-Net (RAU-Net): Ez a komponens dinamikusan állítja be a jellemző térképek méretét, hogy megoldja az objektum megkettőződési problémáját. Alapvetően, ez a rendszer a kép részleteinek megőrzése mellett csökkenti a méretet, hogy illeszkedjen az eredeti képfeldolgozási blokkokhoz.
Modified Shifted Window Multi-head Self-Attention (MSW-MSA): Ez a módszer optimalizált ablakos figyelemmel csökkenti a számítási igényt, ami jelentősen felgyorsítja a képgenerálási folyamatot anélkül, hogy az képminőség romlana.

Eredmények

A HiDiffusion tesztjei során különböző nagy felbontású képek generálása mellett (akár 4096×4096 pixelig) jelentős sebességnövekedést értek el (1,5-6-szor gyorsabb, mint a korábbi módszerek), miközben a képminőség megőrzése is kiemelkedő maradt. A technológia különösen jól teljesített objektumok megkettőződésének minimalizálásában és finom részletek megőrzésében.
A HiDiffusion lehetővé teszi a diffúziós modellek számára, hogy nagy felbontású képeket gyorsan és hatékonyan hozzanak létre, miközben javítja a képminőséget és csökkenti a generálási időt. Ez a fejlesztés új lehetőségeket nyit meg a képgenerálás területén, különösen olyan alkalmazásokban, ahol a kép részleteinek és minőségének megőrzése kritikus fontosságú.

* Legyél Te is Tagja az Mp3Pintyo csatornának *
https://www.youtube.com/channel/UC-3YkVvPQbZiApqrRXEOaPg/join

*** DISCORD***
Mp3Pintyo szerver: https://discord.gg/NBgUuVDURG

*** Támogatás ***
Patreon: https://www.patreon.com/mp3pintyo

*** Linkek ***
Projekt HiDiffusion: https://hidiffusion.github.io/
Kutatási anyag: https://arxiv.org/pdf/2311.17528
Google Colab: https://colab.research.google.com/drive/1EiBn9lSnPZTU4cikRRaBBexs429M-qty?usp=drive_link
GitHub: https://github.com/megvii-research/HiDiffusion
GitHub ComfyUI jank HiDiffusion: https://github.com/blepping/comfyui_jankhidiffusion?tab=readme-ov-file
GitHub ComfyUI-HiDiffusion: https://github.com/florestefano1975/ComfyUI-HiDiffusion
GitHub DemoFusion: https://github.com/PRIS-CV/DemoFusion?tab=readme-ov-file
Google Colab DemoFusion: https://colab.research.google.com/github/camenduru/DemoFusion-colab/blob/main/DemoFusion_colab.ipynb
ComfyUI telepítés: https://youtu.be/XOooCXcAOU4

*** BUYING MY ARTS ***
https://www.etsy.com/shop/mp3pintyo
https://stock.adobe.com/contributor/211260791/zsolt
*** STAY ACTIVE FOR A FOLLOW ***
►TWITTER: https://twitter.com/Mp3Pintyo
►INSTAGRAM: https://www.instagram.com/mp3pintyo/
►PINTEREST: https://www.pinterest.com/mp3pintyo/
►SOUNDCLOUD: https://soundcloud.com/mp3pintyo




Other Videos By Zsolt Pinter


5 days agoOllama: Kezdjed el használni a nagy nyelvi modelleket a saját számítógépeden teljesen ingyenesen
6 days agoTelepítési útmutató 1: Open source, ingyenes alkalmazások telepítése a saját számítógépünkre
2024-05-26Képgenerálás gyorsasági verseny: SDXL DMD2 Turbo Lightning Flash Hyper, LCM, SD15, SSD-1B, Koala 1B
2024-05-23AI Town: egy virtuális város, ahol AI karakterek élnek és beszélgetnek. Itt bármi megtörténhet!
2024-05-20Hunyuan-DiT: SD3 trónkövetelő képgeneráló modell a Tencent konyhájából, ingyenes demo felület
2024-05-14A StoryDiffusion képes konzisztens karakterekkel varázslatos történeteket létrehozni ingyenesen
2024-05-13A titokzatos GPT2 ( GPT-4o ) nagy nyelvi modell összehasonlítása a piacvezető többi LLM rendszerrel
2024-05-12IC-Light: helyezzük a fotóinkat más megvilágításba/új környezetbe teljesen ingyenesen a böngészőben
2024-05-09PuLID: ingyenes képek generálása a saját konzisztens arcunkkal. ComfyUI használata a saját gépünkön
2024-05-06PuLID: ingyenes képek generálása a saját konzisztens arcunkkal, 6 féle lehetőség bemutatása
2024-05-05HiDiffusion: akár 4096x4096 pixel felbontású képek generálása a saját gépünkön bármelyik SD modellel
2024-05-01Szófelhő generálás szöveg alapján a saját gépünkön a ComfyUI segítségével teljesen ingyenesen
2024-04-29Építsd a jövőt a Meta AI Llama 3 ingyenesen hozzáférhető nagy nyelvi modell segítségével
2024-04-28A HairFastGAN módszer egy gyors módszer a hajstílusok digitális átvitelére egyik képről a másikra.
2024-04-24Hipersebesség a képgenerálásban. Készíts minden eddiginél gyorsabban képeket a Hyper-SD segítségével
2024-04-22ELLA: Javított szövegértés a Stable Diffusion 1.5 modellekhez. Ingyenes képgenerálás saját gépen
2024-04-16ZeST: Egyetlen bemeneti kép és egy anyagminta kép alapján hozzunk létre új anyagból álló objektumot
2024-04-11Face to All:készítsünk vicces portrékat a feltöltött arcképekből a böngészőben vagy a saját gépünkön
2024-04-11Stability AI CosXL modell bemutató. Ingyenes képgenerálás és képszerkesztés a ComfyUI felületén
2024-04-09A Brushnet alkalmazás lehetővé teszi, hogy kijelöljünk egy részt a képen és BÁRMIRE lecseréljük
2024-04-04Mostantól szerkeszthetjük a DALL·E képeket a ChatGPT-ben az interneten, iOS-en és Androidon



Tags:
mp3pintyo
mesterséges intelligencia
ai