Fondatorul Midjourney, David Holz, despre impactul AI asupra artei, imaginației și economiei creative

Mijlocul călătoriei este unul dintre principalii factori ai tehnologiei emergente de utilizare a inteligenței artificiale (AI) pentru a crea imagini vizuale din mesaje text. Startup-ul din San Francisco a făcut recent știri ca motorul din spatele operei de artă care a câștigat un premiu într-un concurs echitabil de stat din Colorado și este puțin probabil ca aceasta să fie ultima problemă complicată cu care se va confrunta arta AI în următorii ani.

Midjourney se diferențiază de ceilalți din spațiu prin accentuarea esteticii picturale în imaginile pe care le produce. Platforma nu încearcă să creeze imagini fotorealiste care să poată fi confundate cu fotografii, iar CEO-ul David Holz spune că personal este foarte neliniştit de calitatea uimitoare a deepfake-urilor şi a altor lucrări care simulează prea aproape realitatea. În schimb, Holz spune că Midjourney este conceput pentru a debloca creativitatea oamenilor obișnuiți, oferindu-le instrumente pentru a face imagini frumoase doar prin descrierea lor.

Dar, în ciuda concentrării umaniste, orientate spre consumator al companiei, există întrebări inevitabile cu privire la implicațiile pentru arta comercială și artiștii profesioniști. L-am intervievat pe Holz pentru a o piesă mai amplă despre potențialele perturbări pe care arta AI le poate provoca în producția de imagini pentru divertisment, jocuri video și publicare. Iată un fragment mai lung din conversația noastră, în care Holz oferă mai multă profunzime și context pe măsură ce abordează aceste probleme și explică viziunea sa pentru companie, industrie și tehnologie. Interviul a fost editat pentru lungime și claritate.

Rob Salkowitz, colaborator Forbes: Care este rolul și titlul dvs.?

David Holz, Mijlocul călătoriei. Sunt fondatorul și CEO. De obicei, prefer să fiu numit fondator, pentru că CEO-ul sună foarte business, iar noi nu suntem foarte business. Suntem un laborator de cercetare aplicată care face produse.

Care este misiunea lui Midjourney?

Ne place să spunem că încercăm să extindem puterile imaginative ale speciei umane. Scopul este de a face oamenii mai imaginativi, nu de a face mașini imaginative, ceea ce cred că este o distincție importantă.

Puteți face o scurtă istorie a companiei până în prezent?

Am început să lucrăm la partea de imaginație a companiei noastre cu aproximativ un an și jumătate în urmă. Au fost unele descoperiri în ceea ce privește modelele de difuzie, oamenii înțeleg clip, openAI, așa ceva. Aproape toți cei implicați în asta sunt San Francisco și ne-am dat seama cu toții că acest lucru va deveni serios, că este diferit de multe alte chestii.

Care crede Midjourney ca fiind beneficiul acestei tehnologii text-to-image pentru afaceri și societate?

Cu siguranță sunt mai preocupat de societate decât de afaceri. Suntem un produs de consum, dar poate 30%-50% dintre utilizatorii noștri în acest moment sunt profesioniști. Majoritatea nu sunt. Artiștii de pe platformă ne spun că le permite să fie mai creativi și exploratori la început, venind cu o mulțime de idei într-un timp scurt.

În acest moment, utilizatorii noștri profesioniști folosesc platforma pentru concepere. Cea mai grea parte a [un proiect de artă comercială] este adesea la început, când părțile interesate nu știe ce vor și trebuie să vadă câteva idei la care să reacționeze. Midjourney poate ajuta oamenii să converge spre ideea pe care și-o doresc mult mai rapid, deoarece repetarea acestor concepte este foarte laborioasă.

Un alt avantaj pentru artiști este că oferă oamenilor încredere în domenii în care nu au încredere. Majoritatea, dacă nu toți artiștii simt că există o parte din artă pe care nu o pot face bine. Ar putea fi culori, compoziție, fundal. Avem un designer de personaje celebru care folosește produsul nostru și oamenii îl întreabă de ce ai folosi un AI, deoarece ești deja atât de bun. Și a spus: „Ei bine, sunt bun doar la partea de caracter. Acest lucru mă ajută cu restul, lumea, fundalul, schemele de culori.”

Cam câte persoane folosesc produsul?

Milioane îl folosesc. Discordul nostru este de peste două milioane. Este de departe cel mai mare server Discord activ.

Licența Midjourney permite utilizarea comercială a imaginilor generate de platformă?

Da. Dar dacă lucrați pentru o companie mai mare de un milion de dolari în venituri anuale, vă rugăm să cumpărați o licență corporativă.

Cum a fost construit setul de date?

Este doar o mare zgârietură a internetului. Folosim seturile de date deschise care sunt publicate și instruim în toate acestea. Și aș spune că este ceva ce fac 100% dintre oameni. Nu am fost pretențioși. Știința evoluează rapid în ceea ce privește cantitatea de date de care aveți nevoie cu adevărat, comparativ cu calitatea modelului. Va dura câțiva ani ca să-ți dai seama cu adevărat și, în acel moment, s-ar putea să ai modele pe care le antrenezi cu aproape nimic. Nimeni nu știe cu adevărat ce poate face.

Ați solicitat consimțământul artiștilor în viață sau ați lucrat încă sub drepturi de autor?

Nu. Nu există o modalitate de a obține o sută de milioane de imagini și de a ști de unde vin. Ar fi grozav dacă imaginile ar avea metadate încorporate despre proprietarul drepturilor de autor sau așa ceva. Dar asta nu este un lucru; nu există un registru. Nu există nicio modalitate de a găsi o imagine pe Internet și apoi de a o urmări automat până la un proprietar și apoi de a face orice pentru a o autentifica.

Pot artiștii să nu fie incluși în modelul dvs. de formare a datelor?

Ne uităm la asta. Provocarea acum este să afli care sunt regulile și cum să-ți dai seama dacă o persoană este într-adevăr artistul unei anumite lucrări sau doar își pune numele pe ea. Nu am întâlnit pe nimeni care să dorească ca numele lor să fie scos din setul de date.

Pot artiștii să renunțe să fie numiți în solicitări?

Nu acum. Ne uităm la asta. Din nou, ar trebui să găsim o modalitate de a autentifica acele solicitări, ceea ce se poate complica.

Ce le spuneți artiștilor comerciali preocupați că le va distruge mijloacele de existență? La un moment dat, de ce un director de artă ar angaja un ilustrator pentru a produce lucrări precum artă conceptuală, design de producție, fundaluri – astfel de lucruri – când pot introduce doar solicitări și pot obține rezultate utile mult mai rapid și la un cost mult mai mic?

Mai este multă muncă. Nu este doar ca „fă-mă un fundal”. Ar putea fi de zece ori mai puțină muncă, dar este mult mai multă muncă decât va face un manager.

Cred că există două moduri în care s-ar putea întâmpla asta. O modalitate este să încerci să oferi același nivel de conținut pe care oamenii îl consumă la un preț mai mic, nu? Și cealaltă modalitate de a proceda este să construim conținut extrem de mai bun la prețurile pe care suntem deja dispuși să le cheltuim. Găsesc că majoritatea oamenilor, dacă cheltuiesc deja bani și tu ai de ales între conținut mult mai bun sau conținut mai ieftin, aleg de fapt conținut extrem de mai bun. Piața a stabilit deja un preț pe care oamenii sunt dispuși să-l plătească.

Cred că unii oameni vor încerca să-i elimine pe artiști. Vor încerca să facă ceva asemănător la un cost mai mic și cred că vor eșua pe piață. Cred că piața se va îndrepta către o calitate superioară, mai multă creativitate și un conținut mult mai sofisticat, divers și profund. Iar oamenii care de fapt sunt capabili să folosească artiștii și să folosească instrumentele pentru a face asta sunt cei care vor câștiga.

Aceste tehnologii creează de fapt o apreciere și o alfabetizare mult mai profundă în mediul vizual. S-ar putea să aveți de fapt cererea, să depășiți capacitatea de a produce la acel nivel și atunci poate că veți crește salariile artiștilor. Ar putea fi ciudat, dar asta se va întâmpla. Ritmul creșterii cererii atât pentru calitate, cât și pentru diversitate va duce la realizarea unor proiecte minunate și neașteptate.

O generație de studenți a absolvit școli de artă, mulți dintre ei foarte îndatorați, bazând pe locuri de muncă relativ bine plătite în producția de divertisment, producția de jocuri video, arta comercială și așa mai departe. Cum le afectează apariția platformelor AI text-to-image viitorul?

Cred că unii oameni vor încerca să reducă costurile, iar alții vor încerca să-și extindă ambițiile. Cred că oamenii care își extind ambițiile vor plăti în continuare aceleași salarii, iar oamenii care încearcă să reducă costurile, cred că vor eșua.

Ai este de obicei folosit la scară pentru chestii precum centrele de apeluri sau bagajele de control în aeroporturi și genul de locuri de muncă pe care oamenilor nu le pasă să le facă. Și propunerea de valoare este că îi eliberează pe oameni să facă tipuri de locuri de muncă mai pline de satisfacții și mai interesante. Dar meseriile de artă sunt pline de satisfacții și interesante. Oamenii muncesc toată viața și își dezvoltă abilitățile pentru a obține astfel de locuri de muncă. De ce ați indica această tehnologie la acel nivel al economiei ca un fel de focalizare și prioritate de afaceri pentru lucrurile pe care le faceți?

Personal, nu sunt. Lucrurile mele nu sunt făcute pentru artiști profesioniști. Dacă le place să-l folosească, atunci este grozav. Lucrurile mele sunt făcute pentru oameni care, de exemplu, există această femeie în Hong Kong, și ea a venit la mine și ea îmi spune: „Singurul lucru din Hong Kong pe care părinții tăi nu vor să fii niciodată este un artist, iar eu” sunt bancher acum. Duc o viață bună de bancher. Dar cu Midjourney acum încep de fapt să gust din această experiență de a fi persoana care mi-am dorit de fapt să fiu.” Sau un tip de la stația de camion care își face propriile cărți de baseball cu imagini sălbatice, doar pentru distracție. Este făcut pentru acei oameni, pentru că, la fel ca majoritatea oamenilor, ei nu pot niciodată să facă aceste lucruri.

Este important de subliniat că nu este vorba despre artă. Este vorba despre imaginație. Imaginația este uneori folosită pentru artă, dar adesea nu este. Majoritatea imaginilor create pe Midjourney nu sunt folosite profesional. Nici măcar nu sunt împărtășite. Sunt folosite doar pentru aceste alte scopuri, aceste nevoi foarte umane.

Cu toate acestea, rezultatul produsului dvs. este imagini, care au valoare comercială în context profesional, pe lângă toate celelalte proprietăți. Și acest lucru este foarte perturbator pentru această economie.

Cred că este ca și cum am face o barcă și cineva poate concura cu barca, dar asta nu înseamnă că barca este despre curse. Dacă folosești barca pentru a concura, atunci poate ca, da, sigur. În acel moment este. Dar partea umană contează cu adevărat și cred că nu suntem... Vrem să facem pozele să arate frumos. Nu ne vedem ca încercând să creăm artă ca parte a lucrurilor noastre. Vrem ca lumea să fie mai imaginativă. Preferăm să facem lucruri frumoase decât lucruri urâte.

Credeți că vreun organism guvernamental are jurisdicție sau autoritate să reglementeze această tehnologie? Și dacă da, crezi că ar trebui?

Nu știu. Regulamentul este interesant. Trebuie să echilibrezi libertatea de a face ceva cu libertatea de a fi protejat. Tehnologia în sine nu este problema. E ca apa. Apa poate fi periculoasă, te poți îneca în ea. Dar este și esențial. Nu vrem să interzicem apa doar pentru a evita părțile periculoase.

Ei bine, vrem să fim siguri că apa noastră este curată.

Da asta e adevărat.

Sursa: https://www.forbes.com/sites/robsalkowitz/2022/09/16/midjourney-founder-david-holz-on-the-impact-of-ai-on-art-imagination-and-the- economia-creativa/