ELLA: Javított szövegértés a Stable Diffusion 1.5 modellekhez. Ingyenes képgenerálás saját gépen

Channel:
Subscribers:
3,300
Published on ● Video Link: https://www.youtube.com/watch?v=_6YznuEyNno



Duration: 38:55
290 views
11


A diffúziós modellek figyelemre méltó teljesítményt mutatnak a szöveg-kép generálás területén. E modellek többsége azonban még mindig a CLIP-et használja szövegkódolóként ami korlátozza a sűrű, több objektumot, részletes attribútumokat, összetett kapcsolatokat, hosszú szövegek összehangolását tartalmazó kérések megértésének képességét. Ebben a tanulmányban bemutatnak egy hatékony nagy nyelvi modelladaptert, amelyet ELLA-nak neveznek, amely a szöveg-kép diffúziós modelleket nagy teljesítményű nagy nyelvi modellekkel (LLM) látja el.
A CLIP egy gépi tanulási modell, amelyet az OpenAI fejlesztett ki. A modell összehasonlítja a generált képeket a célként megadott szöveges leírással, és azokat a változatokat részesíti előnyben, amelyek a leíráshoz a legjobban illeszkednek. Ez a megközelítés lehetővé teszi, hogy a képgenerálás sokkal relevánsabb és pontosabb legyen a kívánt témára vonatkozóan.

Az ELLA még a kutatás korai szakaszában van, és még nem végeztünk átfogó tesztelést az ELLA minden lehetséges alkalmazásával kapcsolatban. Szívesen fogadjuk a közösség konstruktív és baráti javaslatait.

* Legyél Te is Tagja az Mp3Pintyo csatornának *
https://www.youtube.com/channel/UC-3YkVvPQbZiApqrRXEOaPg/join

*** DISCORD***
Mp3Pintyo szerver: https://discord.gg/NBgUuVDURG

*** Támogatás ***
Patreon: https://www.patreon.com/mp3pintyo

*** Linkek ***
ELLA: https://ella-diffusion.github.io/
Kutatási anyag: https://arxiv.org/pdf/2403.05135.pdf
GitHub ELLA: https://github.com/TencentQQGYLab/ELLA
GitHub ExponentialML ComfyUI_ELLA: https://github.com/ExponentialML/ComfyUI_ELLA
GitHub kijai ComfyUI-ELLA-wrapper: https://github.com/kijai/ComfyUI-ELLA-wrapper
GitHub Tencent ComfyUI-ELLA: https://github.com/TencentQQGYLab/ComfyUI-ELLA
Modellek: https://huggingface.co/QQGYLab/ELLA/tree/main
Qwen-72B-Chat: https://huggingface.co/spaces/Qwen/Qwen-72B-Chat-Demo
git: https://git-scm.com/downloads
AWPainting: https://civitai.com/models/84476/awpainting

*** BUYING MY ARTS ***
https://www.etsy.com/shop/mp3pintyo
https://stock.adobe.com/contributor/211260791/zsolt
*** STAY ACTIVE FOR A FOLLOW ***
►TWITTER: https://twitter.com/Mp3Pintyo
►INSTAGRAM: https://www.instagram.com/mp3pintyo/
►PINTEREST: https://www.pinterest.com/mp3pintyo/
►SOUNDCLOUD: https://soundcloud.com/mp3pintyo




Other Videos By Zsolt Pinter


2024-05-14A StoryDiffusion képes konzisztens karakterekkel varázslatos történeteket létrehozni ingyenesen
2024-05-13A titokzatos GPT2 ( GPT-4o ) nagy nyelvi modell összehasonlítása a piacvezető többi LLM rendszerrel
2024-05-12IC-Light: helyezzük a fotóinkat más megvilágításba/új környezetbe teljesen ingyenesen a böngészőben
2024-05-09PuLID: ingyenes képek generálása a saját konzisztens arcunkkal. ComfyUI használata a saját gépünkön
2024-05-06PuLID: ingyenes képek generálása a saját konzisztens arcunkkal, 6 féle lehetőség bemutatása
2024-05-05HiDiffusion: akár 4096x4096 pixel felbontású képek generálása a saját gépünkön bármelyik SD modellel
2024-05-01Szófelhő generálás szöveg alapján a saját gépünkön a ComfyUI segítségével teljesen ingyenesen
2024-04-29Építsd a jövőt a Meta AI Llama 3 ingyenesen hozzáférhető nagy nyelvi modell segítségével
2024-04-28A HairFastGAN módszer egy gyors módszer a hajstílusok digitális átvitelére egyik képről a másikra.
2024-04-24Hipersebesség a képgenerálásban. Készíts minden eddiginél gyorsabban képeket a Hyper-SD segítségével
2024-04-22ELLA: Javított szövegértés a Stable Diffusion 1.5 modellekhez. Ingyenes képgenerálás saját gépen
2024-04-16ZeST: Egyetlen bemeneti kép és egy anyagminta kép alapján hozzunk létre új anyagból álló objektumot
2024-04-11Face to All:készítsünk vicces portrékat a feltöltött arcképekből a böngészőben vagy a saját gépünkön
2024-04-11Stability AI CosXL modell bemutató. Ingyenes képgenerálás és képszerkesztés a ComfyUI felületén
2024-04-09A Brushnet alkalmazás lehetővé teszi, hogy kijelöljünk egy részt a képen és BÁRMIRE lecseréljük
2024-04-04Mostantól szerkeszthetjük a DALL·E képeket a ChatGPT-ben az interneten, iOS-en és Androidon
2024-04-04StyleCineGAN: Cinemagraph létrehozása statikus képekből egyetlen gombnyomással az AI segítségével
2024-04-02A ChatGPT végre idézni fogja a forrásokat, amelyekből a válaszokat generálta. Jön a képszerkesztés?
2024-03-27img2img-turbo: AI képalkotás/képátalakítás 1 lépésben. Rajzolj valós időben a böngészőben
2024-03-26Playground v2.5: A legújabb nyílt forráskódú kiemelkedő minőségű generatív modell - Teljes Bemutató
2024-03-23Képjavítók nagy tesztje: Photoshop, Stability AI, Supir, Clarity. Melyik a jobb felskálázó?



Tags:
mp3pintyo
mesterséges intelligencia
ai