Çfarë do të thotë teksti i ri në 3D i Nvidia për inxhinierinë dhe dizajnimin e produktit

tl; dr: Inteligjenca artificiale gjeneruese po evoluon me një ritëm emocionues. Algoritmi i fundit nga Nvidia e konverton tekstin në rrjetë 3D dy herë më shpejt se projektet e publikuara mezi 2 muaj më parë. Kjo do të thotë se aftësitë teknike tashmë po e tejkalojnë aftësinë tonë për të punuar me to.

Javën e kaluar letër nga shkencëtarët e Nvidia demonstruan shpejtësinë eksponenciale me të cilën po evoluon hapësira gjeneruese e AI. Ky shpërthim i aktivitetit – veçanërisht i dukshëm gjatë 9 muajve të fundit – do të ketë ndikim në çdo pjesë të jetës, jo më pak në dizajnimin e produktit, inxhinierinë dhe prodhimin. Ndryshimet do ta heqin industrinë nga kufizimet strukturore në mënyrën e komunikimit të ideve, do të fuqizojnë cikle më të shpejta të inovacionit dhe përfundimisht do ta lejojnë atë të japë premtimet e saj për qëndrueshmëri.

Shembull i rrjetave nga algoritmet Magic 3D të Nvidia Research, me udhëzimet e përdorura për t'i gjeneruar ato.

Nvidia Deep Imagination Research

Duke u thënë prej vitesh se AI do të revolucionarizonte rrënjësisht mënyrën se si ne punojmë, pak prisnin që sektori krijues të ishte ndër viktimat e tij të para. Ardhja e gjeneratorit të tekstit të ngjashëm me njeriun GPT-3 në 2020 solli mundësitë në fokus më të mprehtë. Ka qenë një udhëtim i egër që nga ajo kohë: DALL-E (tekst-në-imazh), Whisper (njohja e të folurit) dhe së fundi Difuzioni i qëndrueshëm (tekst-në-imazh) jo vetëm që rriti aftësitë e të folurit dhe mjeteve vizuale të AI, por gjithashtu reduktoi burimet e nevojshme për t'i përdorur ato (nga 175 miliardë parametra për GPT-3 në 900 milion për Difuzion të Qëndrueshëm).

Madhësia e Stable Diffusion do të thotë më pak se 5 GB hapësirë në disk – e aftë për t'u përdorur në çdo laptop. Jo vetëm ajo; ndryshe nga OpenAI (i cili financohet kryesisht nga Microsoft dhe publikon GPT-3, DALL-E dhe Whisper), Stable Diffusion është me burim të hapur, që do të thotë se të tjerët mund të bazohen në mësimet e tij shumë më lehtë. Kjo do të thotë se ne po shohim vetëm fillimin e ciklit inovativ – ka shumë më tepër për të ardhur, siç tregon tani punimi i Nvidia.

Mbështetësit e Stable Diffusion (stabiliteti.ai) po e turbochargojnë më tej këtë prirje duke ofruar grante teknologjike dhe financiare për ekipet e tjera që e çojnë eksplorimin në drejtime të reja. Për më tepër, një mori projektesh po i bën mjetet të disponueshme për një gamë gjithnjë e më të gjerë përdoruesish. Midis tyre janë shtojcat për Blender, një mjet dizajni me burim të hapur dhe ekuivalenti i pronarit të Photoshop-it të Adobe. Qasja e plotë e API-së në mjetet po financohet me dollarë të mëdhenj Venture Capital, që do të thotë se qindra miliona zhvillues softuerësh, jo vetëm disa qindra mijëra inxhinierë të dhënash, tani do të krijojnë mjetet e tyre në këto algoritme.

Fjalimi, imazhet dhe teksti janë ndër vertikalet e para që prishen nga këto teknologji. Por 3D nuk është shumë prapa. Përtej artit gjenerues të veçantë, karikaturat janë pika e parë e dukshme e aplikimit. Ekziston tashmë një gjenerator Pokémon i bazuar në Difuzionin e Qëndrueshëm. Efektet vizuale dhe filmat janë të radhës. Por shumë sektorë të tjerë ka të ngjarë të ndërpriten – mes tyre dizajni i brendshëm me Interiorai.com që kryeson tarifën.

Në gjithë këtë emocion, aplikimi i inovacioneve në Dizajn dhe Inxhinieri duket si një mendim i mëvonshëm. Megjithatë, ka të ngjarë të jetë zona e ndikuar më së shumti. Sigurisht, ka sfida fillestare: Për një, Stable Diffusion dhe bashkatdhetarët e tij nuk janë ende shumë të saktë. Ky nuk është problem për karikaturat, por është një sfidë e madhe për çdo përpjekje për të transformuar tekstin në gjeometri të plota 3D të përdorura në kontekste industriale. Kjo është një zonë që ka pasur një interes të ri (një projekt i quajtur Bits101 u lançua në Izrael në 2015). Ky mund të jetë graali i shenjtë i industrisë, por ka shumë sfida të ndërmjetme që mund të jenë shumë më të lehta për t'u zgjidhur. Këto përfshijnë njohjen e përmirësuar të objekteve (algoritmi Yolo tashmë po përdoret me efekt të madh), i cili do të çojë në përmirësimin e citimit dhe shënimit - përmirësimin e cilësisë dhe reduktimin e gabimeve. Shtojcat gjithashtu duhet ta bëjnë më të lehtë përdorimin e AI gjeneruese për të zhvilluar dizajne bazë (Primitives), të cilat më pas mund të modifikohen më tej në mjetet e projektimit për të përmirësuar tolerancën sipas kërkesës. Kjo është një qasje e përdorur tashmë në Altair's Inspire, e cila përdori analizën e elementeve të fundme për të bërë të njëjtën gjë. Këta Primitivë mund të shërbejnë gjithashtu si bazë të dhënash sintetike të modeleve me shënime, prej të cilave ka mungesë në industrinë 3D CAD. CEO dhe themeluesi i Physna e thekson këtë në një artikull duke detajuar përpjekjet e tyre për të përdorur këto metoda të reja për të krijuar dizajne të detajuara 3D, të cilat gjithashtu theksojnë një numër grackash në përdorimin e të dhënave sintetike për të drejtuar këto algoritme. biblioteka e veshjes së veglave për të përcaktuar strategjitë më të mira të përpunimit.

Këto sfida janë të rëndësishme dhe fitimprurëse për t'u trajtuar në vetvete dhe për vete. Megjithatë, ndikimi i tyre kryesor do të jetë të ndihmojnë në evoluimin e rrugës nga ideja në dizajn, duke reduktuar përfundimisht mbështetjen në dizajnet 3D për të komunikuar qëllimin. Modelet, qofshin ato 2D ose 3D, kanë shërbyer si mjeti kryesor për përkthimin e nevojave të klientëve në produktet përfundimtare. Kjo e kufizon industrinë sepse këto dizajne shërbejnë si një kuti e zezë në të cilën ruhen të gjitha ato njohuri të vlefshme të klientëve, kufizimet e prodhimit dhe objektivat e kompanisë, të paaftë për t'u shkëputur, por të identifikuar vetëm. Kjo do të thotë që kur diçka ndryshon, është pothuajse e pamundur thjesht të rregullosh dizajnin. Kjo është arsyeja që risitë e prodhimit si printimi 3D kërkojnë një kohë kaq të gjatë për t'u adoptuar dhe për të zhgënjyer vazhdimisht investitorët afatshkurtër. Komponentët që përbëjnë një avion janë "të vendosur" që nga momenti i projektimit, pavarësisht nga një jetë produktive 20-vjeçare. Pothuajse nuk ka hapësirë novacioni – këto duhet të presin lançimin e gjeneratës së ardhshme.

Të jesh në gjendje të ndryshosh një kufizim të vetëm dhe të lejosh një algoritëm të tillë si Difuzioni i qëndrueshëm për të rindërtuar parametrat e dizajnit dhe prodhimit do të përshpejtojë ndjeshëm adoptimin e inovacioneve të reja dhe do të na lejojë të ndërtojmë produkte më të lehta, me performancë më të mirë, më shpejt. Siç bëjnë në Formula 1 ose Dizajnimi i Sistemeve, inxhinierët e ardhshëm do të veprojnë si menaxherë kufizimesh në gjendje të shprehin me fjalë dhe duke iu referuar burimeve të të dhënave se cilat janë objektivat dhe kufizimet e produktit.

Pa përshpejtuar procesin e inxhinierisë për produktet e reja dhe ekzistuese në këtë mënyrë, ne nuk kemi pothuajse asnjë mjet për të arritur objektivat ambicioze të qëndrueshmërisë që duhet t'i vendosim vetes. Për ta bërë këtë, së pari duhet të biem dakord për një gjuhë që mund ta përdorim për të komunikuar përtej modeleve. Ky model i ri semantik është boshllëku i dukshëm në risitë e përshkruara më sipër. Një sërë kompanish tashmë kanë filluar të eksperimentojnë me të, si p.sh nTopologjia me konceptet e saj të Fusave. E megjithatë, ritmi i ndryshimit është i ngadaltë, ndryshe nga algoritmet që do të ushqejë modeli semantik. Algoritmi i ri i Nvidia thuhet se është dy herë më i shpejtë se DreamFusion, botuar më pak se 2 muaj më parë. Kompanitë e produkteve dhe inxhinierisë duhet të punojnë në kapjen e ideve të tyre në mënyra të reja, të dëshmuara për të ardhmen tani, në mënyrë që të shfrytëzojnë sa më shumë mundësitë që ka ky shpërthim i AI gjeneruese. Shpejtësia e ndryshimit në algoritme ka treguar, edhe një herë, se Ligji Morse zbatohet kudo që mjetet po digjitalizohen. Sfida mbetet paaftësia jonë njerëzore për të përqafuar këtë ndryshim dhe për të vendosur metoda të reja komunikimi të afta për të zhbllokuar potencialin e tyre, pavarësisht urgjencës së detyrës.

Burimi: https://www.forbes.com/sites/andrewegner/2022/11/24/what-nvidias-new-text-to-3d-means-for-engineering–product-design/