Generátory umenia AI majú zlý rap pre vytváranie nepresných zobrazení rúk. Postavme Midjourney v5 proti Dall-E 2, aby sme zistili, ktorá je lepšia.
Generátory umenia AI naďalej robia dojem a umožňujú nám vytvárať takmer čokoľvek, čo si dokážeme predstaviť. Zdá sa však, že táto technológia narazila na tehlovú stenu, pokiaľ ide o generovanie realisticky vyzerajúcich rúk.
Tu sa pozrieme na dve z popredných generatívnych umeleckých aplikácií a postavíme ich hlava-nehlava – alebo ruka-to-ruka – aby sme zistili, ktoré môžu generovať lepšie ruky, Midjourney v5 alebo Dall-E 2. Ovládate niektorú z týchto aplikácií? Poďme zistiť!
Problém AI s rukami
Odkedy sa umenie generované AI rozšírilo na internete, došlo k kritike kvalita rúk nakreslených AI. Napriek nedávnym aktualizáciám, ako sa ukázalo v našich porovnaniach vedľa seba, výsledky neboli uspokojivé.
Obaja uchádzači s každou iteráciou zdokonaľovali svoje schopnosti a kvalitu svojich výstupov. Najnovšia aktualizácia, Verzia 5 Midjourney, preukázal pôsobivý pokrok. Problém s rukami nakreslenými AI však zostáva nevyriešený a nemožno ho ignorovať.
Porovnanie 1: Používanie výziev „Ruka“ a „Ruky“
Naše porovnania budú obsahovať presne tie isté výzvy pre Dall-E 2 aj Midjourney v5. Navrhneme výzvy tak, aby boli špecifické pre ruky, namiesto toho, aby sme jednoducho vytvárali ľudí, aby videli, ako ruky vyzerajú. Každej aplikácii tiež dávame iba jednu šancu (hodiť) na každú výzvu.
Ruka
Začnime tou najzákladnejšou a najrelevantnejšou výzvou: „rukou“.
Midjourney v5:
Dall-E 2:
Nezačíname dobre!
Midjourney zvolil nezvyčajnú cestu spájania ruky s dosť kreatívnymi situáciami. Namiesto toho, aby sme sa zamerali len na ruku, vidíme čarodejníka, rukavice, kostru a malú figúrku. Na obrázku rukavíc tiež chýba prst.
Dall-E 2 má opačný prístup a ponúka nám iba jednu ruku na jednoduchom pozadí. Zvláštne je, že existujú zvláštne polohy, najmä s palcami, ktoré nevyzerajú prirodzene ani pohodlne. Každá ruka je tiež odrezaná na jednej zo strán obrázkov.
Kto vyhrá toto kolo? Pre celkovú presnosť to dáme Dall-E 2.
Ruky
Teraz urobme výzvu v množnom čísle „ruky“ a uvidíme, s čím prídu AI.
Midjourney v5:
Dall-E 2:
Midjourneyho pokus o „ruky“ tentokrát dopadne lepšie. Všetky štyri obrázky sú však čiernobiele a chýbajú nám nejaké prsty. Pri bližšom skúmaní môžete tiež vidieť, že niektoré číslice sú zvláštne tvarované alebo prechádzajú jedna do druhej.
Dall-E 2 naďalej obsahuje ruky s jednoduchým pozadím. Nechýbajú žiadne číslice, no ručičky sú na treťom obrázku orezané a ostatné verzie pôsobia akosi nemotorne v kompozícii a úplne im chýba kreativita.
Nazvime toto porovnanie remízou. Dall-E 2 by vyhral pre presnosť, ak by to bol jediný faktor, ale Midjourney nejaký dokáže vytvoriť nádherné snímky v čiernobielom prevedení, aj keď všetky štyri verzie nie sú príliš realistické.
Vždy môžeš pomocou Photoshopu opravte svoje umenie Midjouneyvrátane rúk.
Porovnanie 2: Gestá rúk
Porovnajme pár gest rúk, ktoré sú takmer všeobecne uznávané.
Držím palce
Najprv skúsme „preložiť prsty“.
Midjourney v5:
Dall-E 2:
Dá sa s istotou povedať, že Midjourney túto výzvu úplne pokazil. Chýbajú nám prsty a žiadna z verzií nevyzerá vôbec prirodzene.
Klobúk dole ešte raz pred Dall-E 2 za správny počet prstov, ale to je jediná dobrá správa. Každá verzia vyzerá, akoby prsty udierali do vlastných jogových pozícií v hre Twister.
V tomto porovnaní nie je víťaz.
Palec hore
Ďalej ideme s "palcom hore".
Midjourney v5:
Dall-E 2:
Midjourney zabezpečí správny počet prstov, pričom každú výzvu spracuje kreatívnym spôsobom. Všimli ste si zavedenie názorného štýlu?
Dall-E 2 tiež získava body za presnosť, pričom sa nesnaží rozkolísať loď s niečím kreatívnym pridaným ku každému výsledku.
Nie je tu jasný víťaz.
Porovnanie 3: Ruky s predmetmi
Teraz zvýšime zložitosť tým, že vyzveme ruky, aby interagovali s predmetmi.
Ruka držiaca krištáľovú guľu
Začnime s náhodným objektom pomocou výzvy „ruka drží krištáľovú guľu“.
Midjourney v5:
Dall-E 2:
Keď zvyšujeme zložitosť, Midjourney začína žiariť. Okrem niekoľkých stvárnení vyzerajúcich neprirodzene, ruky a krištáľové gule vyzerajú nádherne. Midjourney dokonca potrebuje čas na vytvorenie odrazov v skle, ktoré určite pridávajú na celkovej kreativite.
Prvýkrát však vidíme, že Dall-E 2 chýba číslica aspoň v jednej z rúk, pričom štvrtá ruka vyzerá jednoducho divne. Krištáľové gule tiež nevyzerajú tak pôsobivo v porovnaní s Midjourney's.
Midjourney získava prvé víťazstvo.
Ruka drží vodu
Skúsme niečo ešte zložitejšie s výzvou „ruka drží vodu“.
Midjourney v5:
Dall-E 2:
Midjourney dokáže hodiť iba jeden obrázok so správnym počtom číslic. Aj keď je to krásne vykreslené, opäť začíname vidieť trhliny v oddelení dôveryhodnosti.
Dall-E 2 tiež bojuje s dosiahnutím prirodzených rúk, ale robí oveľa lepšiu prácu. Pre určitú rozmanitosť prepne aj farbu na pozadí.
Toto kolo dáme Dall-E 2.
Porovnanie 4: Pracovné ruky
Pre toto porovnanie vytvoríme výzvy, ktoré majú ruky zapojené do aktivít.
Hlina na formovanie rúk
Pozrime sa, ako sa modelom AI darí s „hlinou na formovanie rúk“.
Midjourney v5:
Dall-E 2:
Midjourney minul prst na dvoch obrázkoch, ale všetko ostatné vyzerá skvele.
Obrázky Dall-E 2 vyzerajú mätúce a preplnené, pričom v polovici verzií sa uchyľujú k pridaniu rúk inej osoby.
Hrana ide do Midjourney.
Ruky lisovanie cesta
Skúsme podobnú činnosť, „ručné lisovanie cesta“.
Midjourney v5:
Dall-E 2:
Zábery Midjourney celkovo vyzerajú skvele. Polovici z nich však opäť chýbajú číslice. Umeleckému spracovaniu však snímky nemožno vytknúť.
Verziam Dall-E 2 chýbajú prsty aj v polovici prevedení a dokonca jeden pridávajú do poslednej ruky v súprave.
Nazvime to remízou.
Ak by ste si tieto porovnania chceli vyskúšať sami, ukážeme vám to ako použiť Midjourney na vytvorenie umenia AI.
Čo nám hovoria výsledky?
Je zábavné porovnávať a určiť celkového víťaza. A ak by sme si mali vybrať, nazvali by sme to v prospech Midjourney v5. Aj keď Dall-E 2 vytváral ruky so správnym počtom prstov častejšie, bola to práve Midjourney, ktorá vytvorila umelecky stvárnenejšie a príťažlivejšie obrázky.
Obe aplikácie však majú svoje miesto na trhu pre umelcov, ktorí pre svoju prácu znovu používajú obrázky Dall-E 2 a Midjourney. Obaja sú schopní vytvárať ruky, ktoré možno použiť ako výrezy alebo v kompozitoch na umelecké, redakčné a komerčné použitie. Je to len otázka osobných preferencií.
AI si nakoniec podmaní ruky
Generatívne umelecké aplikácie ako Dall-E 2 a Midjourney prešli dlhú cestu vo svojej schopnosti vytvárať realistické a fantastické umenie. Stále zápasia s generovaním rúk, ale vzhľadom na zrýchlenie generatívnej techniky môžeme v blízkej budúcnosti očakávať iba zlepšenie.