HiDiffusion: akár 4096x4096 pixel felbontású képek generálása a saját gépünkön bármelyik SD modellel

Channel:

Zsolt Pinter

Subscribers:

3,300

Published on May 5, 2024 11:04:00 PM ● Video Link: https://www.youtube.com/watch?v=gPP0PJqgPxg

Duration: 32:51

293 views

Nincs szükség képzésre, és csak egy sor kód szükséges az SD-vel generált képek felbontásának és sebességének javításához.
Támogatja a képgenerálás felbontásának 4096×4096-ra növelését, miközben a képgenerálás sebességét 1,5-6-szorosára növeli.
Támogatja az összes SD-modellt, és támogatja az SD-modellek későbbi modelljeit is, mint például a Playground.

Részletes bemutató:
A kutatási anyag a "HiDiffusion" nevű technológia fejlesztését és hatékonyságát mutatja be, ami a diffúziós modellek képalkotási teljesítményét hivatott javítani nagy felbontású képek generálására. A diffúziós modellek alapvetően arra használatosak, hogy adott bemeneti adatok (például szöveges leírások) alapján képeket hozzanak létre. Ezek a modellek viszont korábban korlátozottak voltak a nagyobb felbontású képek gyors és hatékony előállítására.
Mi a probléma a meglévő modellekkel?

A nagy felbontású képek közvetlen generálása a modellekkel problémás lehet, mert az objektumok megkettőződhetnek, és az időigény is jelentősen megnőhet. Ennek két fő oka van:

Objektum megkettőződése: Ez a jelenség a U-Net architektúrában található mély rétegekben megismétlődő jellemzők miatt következik be.
Hatékonysági problémák: Ahogy a képfelbontás növekszik, a generálás ideje exponenciálisan nő, ami a modellek alkalmazhatóságát korlátozza.

Hogyan javítja a HiDiffusion ezeket a problémákat?

A HiDiffusion két fő komponensből áll:

Resolution-Aware U-Net (RAU-Net): Ez a komponens dinamikusan állítja be a jellemző térképek méretét, hogy megoldja az objektum megkettőződési problémáját. Alapvetően, ez a rendszer a kép részleteinek megőrzése mellett csökkenti a méretet, hogy illeszkedjen az eredeti képfeldolgozási blokkokhoz.
Modified Shifted Window Multi-head Self-Attention (MSW-MSA): Ez a módszer optimalizált ablakos figyelemmel csökkenti a számítási igényt, ami jelentősen felgyorsítja a képgenerálási folyamatot anélkül, hogy az képminőség romlana.

Eredmények

A HiDiffusion tesztjei során különböző nagy felbontású képek generálása mellett (akár 4096×4096 pixelig) jelentős sebességnövekedést értek el (1,5-6-szor gyorsabb, mint a korábbi módszerek), miközben a képminőség megőrzése is kiemelkedő maradt. A technológia különösen jól teljesített objektumok megkettőződésének minimalizálásában és finom részletek megőrzésében.
A HiDiffusion lehetővé teszi a diffúziós modellek számára, hogy nagy felbontású képeket gyorsan és hatékonyan hozzanak létre, miközben javítja a képminőséget és csökkenti a generálási időt. Ez a fejlesztés új lehetőségeket nyit meg a képgenerálás területén, különösen olyan alkalmazásokban, ahol a kép részleteinek és minőségének megőrzése kritikus fontosságú.

* Legyél Te is Tagja az Mp3Pintyo csatornának *
https://www.youtube.com/channel/UC-3YkVvPQbZiApqrRXEOaPg/join

*** DISCORD***
Mp3Pintyo szerver: https://discord.gg/NBgUuVDURG

*** Támogatás ***
Patreon: https://www.patreon.com/mp3pintyo

*** Linkek ***
Projekt HiDiffusion: https://hidiffusion.github.io/
Kutatási anyag: https://arxiv.org/pdf/2311.17528
Google Colab: https://colab.research.google.com/drive/1EiBn9lSnPZTU4cikRRaBBexs429M-qty?usp=drive_link
GitHub: https://github.com/megvii-research/HiDiffusion
GitHub ComfyUI jank HiDiffusion: https://github.com/blepping/comfyui_jankhidiffusion?tab=readme-ov-file
GitHub ComfyUI-HiDiffusion: https://github.com/florestefano1975/ComfyUI-HiDiffusion
GitHub DemoFusion: https://github.com/PRIS-CV/DemoFusion?tab=readme-ov-file
Google Colab DemoFusion: https://colab.research.google.com/github/camenduru/DemoFusion-colab/blob/main/DemoFusion_colab.ipynb
ComfyUI telepítés: https://youtu.be/XOooCXcAOU4

*** BUYING MY ARTS ***
► https://www.etsy.com/shop/mp3pintyo
► https://stock.adobe.com/contributor/211260791/zsolt
*** STAY ACTIVE FOR A FOLLOW ***
►TWITTER: https://twitter.com/Mp3Pintyo
►INSTAGRAM: https://www.instagram.com/mp3pintyo/
►PINTEREST: https://www.pinterest.com/mp3pintyo/
►SOUNDCLOUD: https://soundcloud.com/mp3pintyo

Other Videos By Zsolt Pinter

5 days ago	Ollama: Kezdjed el használni a nagy nyelvi modelleket a saját számítógépeden teljesen ingyenesen
6 days ago	Telepítési útmutató 1: Open source, ingyenes alkalmazások telepítése a saját számítógépünkre
2024-05-26	Képgenerálás gyorsasági verseny: SDXL DMD2 Turbo Lightning Flash Hyper, LCM, SD15, SSD-1B, Koala 1B
2024-05-23	AI Town: egy virtuális város, ahol AI karakterek élnek és beszélgetnek. Itt bármi megtörténhet!
2024-05-20	Hunyuan-DiT: SD3 trónkövetelő képgeneráló modell a Tencent konyhájából, ingyenes demo felület
2024-05-14	A StoryDiffusion képes konzisztens karakterekkel varázslatos történeteket létrehozni ingyenesen
2024-05-13	A titokzatos GPT2 ( GPT-4o ) nagy nyelvi modell összehasonlítása a piacvezető többi LLM rendszerrel
2024-05-12	IC-Light: helyezzük a fotóinkat más megvilágításba/új környezetbe teljesen ingyenesen a böngészőben
2024-05-09	PuLID: ingyenes képek generálása a saját konzisztens arcunkkal. ComfyUI használata a saját gépünkön
2024-05-06	PuLID: ingyenes képek generálása a saját konzisztens arcunkkal, 6 féle lehetőség bemutatása
2024-05-05	HiDiffusion: akár 4096x4096 pixel felbontású képek generálása a saját gépünkön bármelyik SD modellel
2024-05-01	Szófelhő generálás szöveg alapján a saját gépünkön a ComfyUI segítségével teljesen ingyenesen
2024-04-29	Építsd a jövőt a Meta AI Llama 3 ingyenesen hozzáférhető nagy nyelvi modell segítségével
2024-04-28	A HairFastGAN módszer egy gyors módszer a hajstílusok digitális átvitelére egyik képről a másikra.
2024-04-24	Hipersebesség a képgenerálásban. Készíts minden eddiginél gyorsabban képeket a Hyper-SD segítségével
2024-04-22	ELLA: Javított szövegértés a Stable Diffusion 1.5 modellekhez. Ingyenes képgenerálás saját gépen
2024-04-16	ZeST: Egyetlen bemeneti kép és egy anyagminta kép alapján hozzunk létre új anyagból álló objektumot
2024-04-11	Face to All:készítsünk vicces portrékat a feltöltött arcképekből a böngészőben vagy a saját gépünkön
2024-04-11	Stability AI CosXL modell bemutató. Ingyenes képgenerálás és képszerkesztés a ComfyUI felületén
2024-04-09	A Brushnet alkalmazás lehetővé teszi, hogy kijelöljünk egy részt a képen és BÁRMIRE lecseréljük
2024-04-04	Mostantól szerkeszthetjük a DALL·E képeket a ChatGPT-ben az interneten, iOS-en és Androidon

Tags:

mp3pintyo

mesterséges intelligencia

Channel	Latest
Gamebrott	6 hours ago
xxDrAiNxx	6 hours ago
Faris AA	6 hours ago
Kenpcgames	6 hours ago
KZee	6 hours ago
あおぎり高校/Vtuber High School	6 hours ago
OzomaLp	6 hours ago
Omega Sisters	6 hours ago
Esoni TV	6 hours ago
Joni Gamerz	6 hours ago
OuixZ	6 hours ago
INSPI GAMING	6 hours ago
Games and More Channel Productions	6 hours ago
KUN	6 hours ago
DerivedWhale45	6 hours ago
bisnap	6 hours ago
Aqua Ch. 湊あくあ	6 hours ago
Kañas y Juegos [KvkTaz]	6 hours ago
Setrof23	6 hours ago
比良坂芽衣 Hirasaka,mei Channel	6 hours ago
Ventus SGN	6 hours ago
tNo & Barunka	6 hours ago
Furo	6 hours ago
Ninjangot	6 hours ago
Richard Yamato	6 hours ago