Themeluesi i Midjourney David Holz mbi ndikimin e AI në art, imagjinatë dhe ekonominë krijuese

Mesi i udhëtimit është një nga drejtuesit kryesorë të teknologjisë në zhvillim të përdorimit të inteligjencës artificiale (AI) për të krijuar imazhe vizuale nga kërkesat e tekstit. Startup me bazë në San Francisko kohët e fundit u bë lajm si motori prapa veprës së artit që fitoi një çmim në një konkurs të panairit të shtetit të Kolorados, dhe kjo nuk ka gjasa të jetë çështja e fundit e ndërlikuar me të cilën do të përballet arti i AI në vitet e ardhshme.

Midjourney dallon nga të tjerët në hapësirë ​​duke theksuar estetikën piktoreske në imazhet që prodhon. Platforma nuk po përpiqet të krijojë imazhe fotorealiste që mund të ngatërrohen me fotografi, dhe CEO David Holz thotë se ai personalisht është shumë i shqetësuar me cilësinë e çuditshme të falsifikimit të thellë dhe punëve të tjera që simulojnë realitetin nga afër. Në vend të kësaj, Holz thotë se Midjourney është krijuar për të zhbllokuar krijimtarinë e njerëzve të zakonshëm duke u dhënë atyre mjete për të bërë fotografi të bukura vetëm duke i përshkruar ato.

Por pavarësisht fokusit humanist, të orientuar nga konsumatori i kompanisë, ka pyetje të pashmangshme në lidhje me implikimet për artin komercial dhe artistët profesionistë. Kam intervistuar Holz për një pjesë më e gjerë mbi ndërprerjet e mundshme që arti i AI mund të shkaktojë në prodhimin e imazheve për argëtim, videolojëra dhe botime. Këtu është një fragment më i gjatë nga biseda jonë ku Holz jep më shumë thellësi dhe kontekst ndërsa trajton ato çështje dhe shpjegon vizionin e tij për kompaninë, industrinë dhe teknologjinë. Intervista është redaktuar për gjatësi dhe qartësi.

Rob Salkowitz, Kontribues i Forbes: Cili është roli dhe titulli juaj?

David Holz, Midjourney. Unë jam themeluesi dhe CEO. Unë zakonisht preferoj të quhem themelues, megjithatë, sepse CEO tingëllon shumë biznesi, dhe ne nuk jemi shumë biznesmen. Ne jemi një laborator kërkimor i aplikuar që prodhon produkte.

Cili është misioni i Midjourney?

Na pëlqen të themi se po përpiqemi të zgjerojmë fuqitë imagjinative të specieve njerëzore. Qëllimi është t'i bëjmë njerëzit më imagjinarë, jo të bëjmë makina imagjinative, gjë që mendoj se është një dallim i rëndësishëm.

A mund të jepni një histori të shkurtër të kompanisë deri më sot?

Ne kemi filluar të punojmë në pjesën e imagjinatës së kompanisë sonë rreth një vit e gjysmë më parë. Kishte disa përparime në modelet e difuzionit, njerëzit që kuptonin klipin, openAI, diçka e tillë. Pothuajse të gjithë të përfshirë në këtë janë San Francisko dhe të gjithë e kuptuam se kjo do të bëhet serioze, se është e ndryshme nga shumë gjëra të tjera.

Çfarë sheh Midjourney si përfitim nga kjo teknologji tekst-për-imazh për biznesin dhe shoqërinë?

Unë jam padyshim më i shqetësuar për shoqërinë sesa për biznesin. Ne jemi një produkt konsumi, por ndoshta 30%-50% e përdoruesve tanë tani janë profesionistë. Shumica nuk janë. Artistët në platformë na thonë se kjo i lejon ata të jenë më kreativë dhe eksplorues në fillim, duke dalë me shumë ide në një kohë të shkurtër.

Tani për tani, përdoruesit tanë profesionistë po përdorin platformën për konceptim. Pjesa më e vështirë e [një projekti artistik komercial] është shpesh në fillim, kur palët e interesuara nuk e dinë se çfarë duan dhe duhet të shohin disa ide për të reaguar. Midjourney mund t'i ndihmojë njerëzit të konvergojnë në idenë që duan shumë më shpejt, sepse përsëritja e këtyre koncepteve është shumë e mundimshme.

Një avantazh tjetër për artistët është se u jep njerëzve besim në fushat në të cilat nuk kanë besim. Shumica, nëse jo të gjithë artistët ndihen sikur ka një pjesë të artit që nuk mund ta bëjnë mirë. Mund të jenë ngjyrat, kompozimet, sfondet. Ne kemi një stilist të famshëm të personazheve që përdor produktin tonë dhe njerëzit e pyesin atë pse do të përdorje një AI meqenëse tashmë je kaq i mirë. Dhe ai tha: “Epo, unë jam i mirë vetëm në pjesën e karakterit. Kjo po më ndihmon me pjesën tjetër, botën, sfondin, skemat e ngjyrave.”

Rreth sa njerëz e përdorin produktin?

Miliona po e përdorin atë. Mosmarrëveshja jonë është mbi dy milionë. Është serveri më i madh aktiv Discord deri tani.

A lejon licenca e Midjourney përdorimin komercial të imazheve të krijuara nga platforma?

Po. Por nëse jeni duke punuar për një kompani më të madhe se një milion dollarë të ardhura vjetore, ne ju kërkojmë të blini një licencë korporate.

Si u ndërtua grupi i të dhënave?

Është vetëm një gërvishtje e madhe e internetit. Ne përdorim grupet e të dhënave të hapura që publikohen dhe stërvitemi me to. Dhe unë do të thoja se kjo është diçka që 100% e njerëzve e bëjnë. Ne nuk ishim zgjedhës. Shkenca me të vërtetë po evoluon shpejt për sa i përket sasisë së të dhënave që ju nevojiten vërtet, kundrejt cilësisë së modelit. Do të duhen disa vite për t'i kuptuar me të vërtetë gjërat, dhe deri në atë kohë, mund të keni modele që i stërvitni pothuajse pa asgjë. Askush nuk e di vërtet se çfarë mund të bëjë.

A kërkuat pëlqimin nga artistë të gjallë apo punoni ende nën të drejtën e autorit?

Jo. Nuk ka vërtet një mënyrë për të marrë njëqind milionë imazhe dhe për të ditur se nga vijnë ato. Do të ishte mirë nëse imazhet do të kishin meta të dhëna të ngulitura në to për pronarin e të drejtës së autorit ose diçka tjetër. Por kjo nuk është një gjë; nuk ka një regjistër. Nuk ka asnjë mënyrë për të gjetur një fotografi në internet, dhe më pas ta gjurmoni automatikisht te një pronar dhe më pas të keni ndonjë mënyrë për të bërë ndonjë gjë për ta vërtetuar atë.

A mund të zgjedhin artistët të mos përfshihen në modelin tuaj të trajnimit të të dhënave?

Ne po e shikojmë atë. Sfida tani është të zbuloni se cilat janë rregullat dhe si të kuptoni nëse një person është me të vërtetë artisti i një vepre të caktuar ose thjesht vendos emrin e tij mbi të. Nuk kemi hasur në askënd që dëshiron që emri i tij të hiqet nga grupi i të dhënave.

A mund të zgjedhin artistët të mos emërohen në kërkesat?

Jo tani. Ne po e shikojmë atë. Përsëri, ne do të duhet të gjejmë një mënyrë për t'i vërtetuar ato kërkesa, të cilat mund të ndërlikohen.

Çfarë u thoni artistëve komercialë të shqetësuar se kjo do të shkatërrojë jetesën e tyre? Në një moment të caktuar, përse një drejtor arti do të punësonte një ilustrues për të prodhuar vepra si koncept arti, dizajni i prodhimit, sfondet – këto lloj gjërash – kur ata thjesht mund të futin kërkesa dhe të marrin rezultate të dobishme shumë më shpejt dhe me kosto shumë më të ulët?

Është ende shumë punë. Nuk është thjesht si "më bëj një sfond". Mund të jetë dhjetë herë më pak punë, por është shumë më tepër punë se sa një menaxher do të bëjë.

Unë mendoj se ka dy mënyra se si kjo mund të shkojë. Një mënyrë është të përpiqeni të siguroni të njëjtin nivel të përmbajtjes që njerëzit konsumojnë me një çmim më të ulët, apo jo? Dhe mënyra tjetër për ta bërë këtë është të ndërtojmë përmbajtje jashtëzakonisht më të mirë me çmimet që ne jemi tashmë të gatshëm të shpenzojmë. Unë konstatoj se shumica e njerëzve, nëse tashmë po shpenzojnë para, dhe ju keni zgjedhjen midis përmbajtjes jashtëzakonisht më të mirë ose përmbajtjes më të lirë, në fakt zgjedhin përmbajtje jashtëzakonisht më të mirë. Tregu ka vendosur tashmë një çmim që njerëzit janë të gatshëm të paguajnë.

Unë mendoj se disa njerëz do të përpiqen t'i heqin artistët. Ata do të përpiqen të bëjnë diçka të ngjashme me një kosto më të ulët dhe mendoj se do të dështojnë në treg. Mendoj se tregu do të shkojë drejt cilësisë më të lartë, më shumë kreativitetit dhe përmbajtjes shumë më të sofistikuar, të larmishme dhe të thellë. Dhe njerëzit që në fakt janë në gjendje të përdorin si artistët dhe përdorin mjetet për ta bërë këtë janë ata që do të fitojnë.

Këto teknologji në fakt krijojnë një vlerësim dhe njohuri shumë më të thellë në mediumin vizual. Ju mund të keni në fakt kërkesën, të tejkaloni aftësinë për të prodhuar në atë nivel, dhe atëherë ndoshta do të rrisni pagat e artistëve. Mund të jetë e çuditshme, por kjo është ajo që do të ndodhë. Ritmi i rritjes së kërkesës për cilësinë dhe diversitetin do të çojë në realizimin e disa projekteve të mrekullueshme dhe të papritura.

Një brez studentësh u diplomuan në shkolla arti, shumë prej tyre me borxhe të mëdha, duke llogaritur në punë relativisht të paguara në prodhimin e argëtimit, prodhimin e lojërave video, artin komercial e kështu me radhë. Si ndikon shfaqja e platformave tekst-për-imazh të AI-së në të ardhmen e tyre?

Unë mendoj se disa njerëz do të përpiqen të ulin kostot, dhe disa njerëz do të përpiqen të zgjerojnë ambiciet. Unë mendoj se njerëzit që zgjerojnë ambiciet do të vazhdojnë të paguajnë të gjitha ato paga të njëjta, dhe njerëzit që përpiqen të ulin kostot, mendoj se do të dështojnë.

Ai zakonisht përdoret në shkallë për gjëra të tilla si qendrat e thirrjeve ose kontrolli i bagazheve në aeroporte dhe llojet e punëve që njerëzve nuk u intereson vërtet të bëjnë. Dhe propozimi i vlerës është se i liron njerëzit të bëjnë punë më të dobishme dhe më interesante. Por punët e artit janë shpërblyese dhe interesante. Njerëzit punojnë gjatë gjithë jetës së tyre dhe zhvillojnë aftësitë e tyre për të marrë këto lloj pune. Pse do ta drejtonit këtë teknologji në atë nivel të ekonomisë si një lloj fokusi dhe prioriteti biznesi për gjërat që po bëni?

Personalisht, nuk jam. Gjërat e mia nuk janë krijuar për artistë profesionistë. Nëse u pëlqen ta përdorin atë, atëherë kjo është e mrekullueshme. Gjërat e mia janë krijuar për njerëzit që, si p.sh., është kjo grua në Hong Kong, dhe ajo erdhi tek unë, dhe ajo thotë: "E vetmja gjë në Hong Kong që prindërit tuaj nuk duan kurrë që ju të jeni është një artist, dhe unë" jam bankier tani. Unë po bëj një jetë të mirë bankiere. Por me Midjourney tani në fakt po filloj të shijoj këtë përvojë të të qenit personi që doja të isha në të vërtetë.” Ose një djalë në stacionin e kamionit që po bën letrat e tij të bejsbollit me imazhe të egra, vetëm për argëtim. Është krijuar për ata njerëz, sepse, si shumica e njerëzve, ata kurrë nuk arrijnë t'i bëjnë këto gjëra.

Është e rëndësishme të theksohet se kjo nuk ka të bëjë me artin. Kjo ka të bëjë me imagjinatën. Imagjinata përdoret ndonjëherë për art, por shpesh nuk është. Shumica e imazheve të krijuara në Midjourney nuk po përdoren në mënyrë profesionale. Ata as nuk po ndahen. Ato thjesht po përdoren për këto qëllime të tjera, këto nevoja shumë njerëzore.

Megjithatë, prodhimi i produktit tuaj është imazhi, i cili ka vlerë komerciale në kontekstin profesional, përveç të gjitha atyre vetive të tjera. Dhe kjo është shumë shkatërruese e asaj ekonomie.

Unë mendoj se është sikur po bëjmë një varkë, dhe dikush mund të garojë me varkën, por kjo nuk do të thotë se varka ka të bëjë me garat. Nëse përdorni varkën për të garuar, atëherë ndoshta po, sigurisht. Në atë moment është. Por ana njerëzore ka vërtet rëndësi, dhe unë mendoj se ne nuk jemi… Ne duam t'i bëjmë fotografitë të duken bukur. Ne nuk e shohim veten sikur përpiqemi të krijojmë art si pjesë e gjësë sonë. Ne duam që bota të jetë më imagjinative. Më mirë do të bënim gjëra të bukura sesa gjëra të shëmtuara.

A besoni se ndonjë organ qeveritar ka juridiksion ose autoritet për të rregulluar këtë teknologji? Dhe nëse po, a mendoni se duhet?

Une nuk e di. Rregullorja është interesante. Ju duhet të balanconi lirinë për të bërë diçka me lirinë për t'u mbrojtur. Vetë teknologjia nuk është problemi. Është si uji. Uji mund të jetë i rrezikshëm, mund të mbyteni në të. Por është gjithashtu thelbësore. Ne nuk duam të ndalojmë ujin vetëm për të shmangur pjesët e rrezikshme.

Epo, ne duam të jemi të sigurt që uji ynë është i pastër.

Po, ajo është e vërtetë.

Burimi: https://www.forbes.com/sites/robsalkowitz/2022/09/16/midjourney-founder-david-holz-on-the-impact-of-ai-on-art-imagination-and-the- kreative-ekonomi/