O privire asupra noii Al Generative Art

Al Generative Art este un tip de artă, în cele mai multe cazuri vizuală, care se bazează pe cooperarea dintre o ființă umană și un sistem autonom. Un „sistem autonom” este definit ca un Inteligenta Artificiala software, algoritm sau model capabil să efectueze operații complexe fără a fi nevoie de intervenția programatorului.

Din juxtapuneri bizare de imagini create de Dall-E Mini la NFT pe piață, imaginile generate de algoritmi AI intră din ce în ce mai mult în imaginația mainstream. De altfel, două proiecte importante pe această temă care merită să fie analizate sunt: Mijlocul călătoriei și DALL-E2.

Desigur, știrea și-a făcut drum și pe Twitter. Comentând, printre alții, Charles Hoskinson, care a scris:

AI a generat artă. Am reușit să fac această poză în doar câteva minute. Nu-mi pot imagina cât de remarcabilă va fi această tehnologie în 3 ani pic.twitter.com/jOToCZj7ki
- Charles Hoskinson (@IOHK_Charles) 1 Februarie 2023

Al Generative Art: experimente și caracteristici timpurii

După ce am înțeles ce este Arta Generativă, este important să subliniem unul dintre principiile sale fondatoare: dezordine. Care este o proprietate fundamentală a Artei Generative.

De fapt, în funcție de tipul de software, sistemul autonom este capabil să proceseze rezultate care sunt întotdeauna diferite și unice de fiecare dată când comanda generare este executată sau poate returna un număr variabil de rezultate ca răspuns la intrarea utilizatorului.

Primele experimente în Arta Generativă datează din anii 1960 cu experimentele de Harold Cohen și sa AARON program. Cohen a folosit pentru prima dată software autonom pentru a genera opere de artă abstracte inspirate de serigrafiile Pop Art. Lucrările lui Cohen sunt acum expuse la Tate Gallery din Londra.

Un alt atribut al Artei Generative, dar unul din ce în ce mai puțin o prerogativă, este repetarea tiparelor sau elementelor abstracte furnizate de programator și implementate în cadrul codului software.

În plus, dezvoltarea rețelelor neuronale din ce în ce mai complexe care funcționează pe asociere text-imagine a permis dezvoltarea unor modele generative capabile să creeze imagini din ce în ce mai realiste și mai precise. Cel mai cunoscut exemplu al acestei categorii de Artă Generativă este Dală.

Dall-E este o rețea neuronală multimodală bazată pe GPT-3 model de învățare profundă din OpenAI, aceeași companie care s-a dezvoltat și ea recent Chat GPT, chatbot-ul lansat în noiembrie 2022 și optimizat cu „supravegheat” și tehnici de învățare prin întărire.

Revenind la Dall-E, vedem că acest sistem este capabil să genereze imagini dintr-o descriere textuală, numită a "prompt," pe baza unui set de date de perechi text-imagine.

Prima versiune de Dall-E, care a fost prezentată publicului în ianuarie 2021 și a rămas apanajul unui număr restrâns de profesioniști din domeniu, a reprezentat o adevărată revoluție în ceea ce privește acest tip de model generativ, depășind inovațiile GPT- 3 în sine.

De asemenea, este semnificativ și faptul că acuratețea rezultatelor procesate de Dall-E s-a dovedit a fi domeniul perfect pentru o altă soluție OpenAI: CLIP (Pre-antrenament contrastant limbaj-imagine).

O rețea neuronală de clasificare și clasificare a imaginilor, antrenată pe baza asocierilor text-imagine, cum ar fi legendele găsite pe Internet. Datorită intervenției CLIP, care reduce numărul de rezultate propuse utilizatorului per prompt la 32, s-a constatat că Dall-E returnează imagini satisfăcătoare în majoritatea cazurilor.

Midjourney: design, infrastructură umană și inteligență artificială

După cum era anticipat, Mijlocul călătoriei este un proiect important care face parte din conceptul emergent Al Generative Art. Mai exact, Midjourney este un laborator de cercetare independent care explorează noi mijloace de gândire și extinde puterile imaginative ale speciei umane.

Utilizarea este simplă: mai întâi trebuie creat un cont Discordie, o platformă care găzduiește diverse comunități, unde Midjourney este una dintre ele. În cadrul aplicației se află diversele camere de chat în care se poate participa activ sau nu la discuții.

Este important de subliniat că, pentru a încerca să utilizați Inteligența Artificială pentru prima dată, trebuie să mergeți la „începători” canale, unde 25 de randări gratuite sunt disponibile.

O randare corespunde generarii a patru variante diferite generate din aceeasi intrare textuala.

Astfel, cele 25 de randări se referă la 25 de joburi de procesare efectuate de botul Midjourney. În consecință, generarea imaginii necesită interacțiunea cu botul Midjourney printr-un mesaj text numit „prompt”, în care vor exista cuvinte cheie care descriu imaginea pe care utilizatorul o are în minte.

Puteți adăuga câte detalii doriți, important este să împărțiți cuvintele cheie cu virgulă. Odată ce randarea este terminată, computerul returnează patru imagini diferite pe baza descrierilor din care să alegeți.

În plus, odată ce programul s-a terminat de randare, poți să-ți comunici preferințele pe baza imaginilor și, dacă dorești, să ai din nou generate încă patru versiuni.

DALL-E 2: noul sistem AI pentru opere de artă

Pe lângă Midjourney, DALL-E 2 este și noul sistem AI care poate crea imagini și lucrări de artă realiste dintr-o descriere în limbaj natural. Nu numai că, DALL-E 2 poate combina și concepte, atribute și stiluri.

Puterea noului sistem AI constă, de asemenea, în posibilitatea de a extinde imaginile dincolo de ceea ce este în pânza originală, creând noi compoziţii expansive. În plus, poate face modificări realiste imaginilor existente dintr-o legendă în limbaj natural și poate adăuga și elimina elemente ținând cont de umbre, reflexii și texturi.

Capacitățile DALL-E 2 includ, de asemenea, realizarea unei imagini și crearea mai multor variante ale acesteia inspirate de original. DALL-E 2 a învățat relația dintre imagini și textul folosit pentru a le descrie.

Utilizează un proces numit „difuzie”, care începe cu un model de puncte aleatorii și modifică treptat acel model spre o imagine atunci când recunoaște aspecte specifice ale acelei imagini.

Deci, după ce OpenAI a introdus DALL-E în ianuarie 2021, acum cel mai nou sistem, DALL-E 2, generează imagini mai realiste și mai precise, cu o rezoluție de patru ori mai mare.

DALL-E 2 a început ca un proiect de cercetare și este acum disponibil ca un versiune beta. Atenuările de securitate pe care sistemul le-a dezvoltat și continuă să le îmbunătățească includ: limitarea capacității sistemului de a genera imagini violente, de ură sau pentru adulți și implementarea în etape bazată pe învățare.

Sursa: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/