ELLA: Javított szövegértés a Stable Diffusion 1.5 modellekhez. Ingyenes képgenerálás saját gépen

Channel:

Zsolt Pinter

Subscribers:

3,300

Published on April 22, 2024 5:21:55 PM ● Video Link: https://www.youtube.com/watch?v=_6YznuEyNno

Duration: 38:55

290 views

A diffúziós modellek figyelemre méltó teljesítményt mutatnak a szöveg-kép generálás területén. E modellek többsége azonban még mindig a CLIP-et használja szövegkódolóként ami korlátozza a sűrű, több objektumot, részletes attribútumokat, összetett kapcsolatokat, hosszú szövegek összehangolását tartalmazó kérések megértésének képességét. Ebben a tanulmányban bemutatnak egy hatékony nagy nyelvi modelladaptert, amelyet ELLA-nak neveznek, amely a szöveg-kép diffúziós modelleket nagy teljesítményű nagy nyelvi modellekkel (LLM) látja el.
A CLIP egy gépi tanulási modell, amelyet az OpenAI fejlesztett ki. A modell összehasonlítja a generált képeket a célként megadott szöveges leírással, és azokat a változatokat részesíti előnyben, amelyek a leíráshoz a legjobban illeszkednek. Ez a megközelítés lehetővé teszi, hogy a képgenerálás sokkal relevánsabb és pontosabb legyen a kívánt témára vonatkozóan.

Az ELLA még a kutatás korai szakaszában van, és még nem végeztünk átfogó tesztelést az ELLA minden lehetséges alkalmazásával kapcsolatban. Szívesen fogadjuk a közösség konstruktív és baráti javaslatait.

* Legyél Te is Tagja az Mp3Pintyo csatornának *
https://www.youtube.com/channel/UC-3YkVvPQbZiApqrRXEOaPg/join

*** DISCORD***
Mp3Pintyo szerver: https://discord.gg/NBgUuVDURG

*** Támogatás ***
Patreon: https://www.patreon.com/mp3pintyo

*** Linkek ***
ELLA: https://ella-diffusion.github.io/
Kutatási anyag: https://arxiv.org/pdf/2403.05135.pdf
GitHub ELLA: https://github.com/TencentQQGYLab/ELLA
GitHub ExponentialML ComfyUI_ELLA: https://github.com/ExponentialML/ComfyUI_ELLA
GitHub kijai ComfyUI-ELLA-wrapper: https://github.com/kijai/ComfyUI-ELLA-wrapper
GitHub Tencent ComfyUI-ELLA: https://github.com/TencentQQGYLab/ComfyUI-ELLA
Modellek: https://huggingface.co/QQGYLab/ELLA/tree/main
Qwen-72B-Chat: https://huggingface.co/spaces/Qwen/Qwen-72B-Chat-Demo
git: https://git-scm.com/downloads
AWPainting: https://civitai.com/models/84476/awpainting

*** BUYING MY ARTS ***
► https://www.etsy.com/shop/mp3pintyo
► https://stock.adobe.com/contributor/211260791/zsolt
*** STAY ACTIVE FOR A FOLLOW ***
►TWITTER: https://twitter.com/Mp3Pintyo
►INSTAGRAM: https://www.instagram.com/mp3pintyo/
►PINTEREST: https://www.pinterest.com/mp3pintyo/
►SOUNDCLOUD: https://soundcloud.com/mp3pintyo

Other Videos By Zsolt Pinter

2024-05-14	A StoryDiffusion képes konzisztens karakterekkel varázslatos történeteket létrehozni ingyenesen
2024-05-13	A titokzatos GPT2 ( GPT-4o ) nagy nyelvi modell összehasonlítása a piacvezető többi LLM rendszerrel
2024-05-12	IC-Light: helyezzük a fotóinkat más megvilágításba/új környezetbe teljesen ingyenesen a böngészőben
2024-05-09	PuLID: ingyenes képek generálása a saját konzisztens arcunkkal. ComfyUI használata a saját gépünkön
2024-05-06	PuLID: ingyenes képek generálása a saját konzisztens arcunkkal, 6 féle lehetőség bemutatása
2024-05-05	HiDiffusion: akár 4096x4096 pixel felbontású képek generálása a saját gépünkön bármelyik SD modellel
2024-05-01	Szófelhő generálás szöveg alapján a saját gépünkön a ComfyUI segítségével teljesen ingyenesen
2024-04-29	Építsd a jövőt a Meta AI Llama 3 ingyenesen hozzáférhető nagy nyelvi modell segítségével
2024-04-28	A HairFastGAN módszer egy gyors módszer a hajstílusok digitális átvitelére egyik képről a másikra.
2024-04-24	Hipersebesség a képgenerálásban. Készíts minden eddiginél gyorsabban képeket a Hyper-SD segítségével
2024-04-22	ELLA: Javított szövegértés a Stable Diffusion 1.5 modellekhez. Ingyenes képgenerálás saját gépen
2024-04-16	ZeST: Egyetlen bemeneti kép és egy anyagminta kép alapján hozzunk létre új anyagból álló objektumot
2024-04-11	Face to All:készítsünk vicces portrékat a feltöltött arcképekből a böngészőben vagy a saját gépünkön
2024-04-11	Stability AI CosXL modell bemutató. Ingyenes képgenerálás és képszerkesztés a ComfyUI felületén
2024-04-09	A Brushnet alkalmazás lehetővé teszi, hogy kijelöljünk egy részt a képen és BÁRMIRE lecseréljük
2024-04-04	Mostantól szerkeszthetjük a DALL·E képeket a ChatGPT-ben az interneten, iOS-en és Androidon
2024-04-04	StyleCineGAN: Cinemagraph létrehozása statikus képekből egyetlen gombnyomással az AI segítségével
2024-04-02	A ChatGPT végre idézni fogja a forrásokat, amelyekből a válaszokat generálta. Jön a képszerkesztés?
2024-03-27	img2img-turbo: AI képalkotás/képátalakítás 1 lépésben. Rajzolj valós időben a böngészőben
2024-03-26	Playground v2.5: A legújabb nyílt forráskódú kiemelkedő minőségű generatív modell - Teljes Bemutató
2024-03-23	Képjavítók nagy tesztje: Photoshop, Stability AI, Supir, Clarity. Melyik a jobb felskálázó?

Tags:

mp3pintyo

mesterséges intelligencia

Channel	Latest
VEGETTA777	7 hours ago
Gouenji FF	7 hours ago
3p Venom GAMES	7 hours ago
Kummoto	7 hours ago
Tifany	7 hours ago
Morsey	7 hours ago
Sparkour	7 hours ago
ー夜叉姫ーちゃんねる	7 hours ago
MASTER Jellybean	7 hours ago
Lordromawi	8 hours ago
PG GAMES	8 hours ago
DrakeWingGaming	8 hours ago
CGKOSE	8 hours ago
Boring Bones Tv	8 hours ago
SOMOS MORTAL KOMBAT	8 hours ago
Ione Gamer	8 hours ago
Mr POP Streaming	8 hours ago
Retro VHS Gaming Videos	8 hours ago
Лав и лаВ	8 hours ago
Crab Hands	8 hours ago
Panda GG	8 hours ago
Juna JRX	8 hours ago
Atubois	8 hours ago
Shadow Blaze	8 hours ago
ShiandeGames	8 hours ago