Sa e vështirë duhet të shtyjmë ChatGPT gjeneruese të AI në përhapjen e gjuhës së urrejtjes, pyet Etikën e AI dhe ligjin e AI

Të gjithë kanë pikën e tyre të thyerjes.

Unë mendoj se ju gjithashtu mund të thoni këtë gjithçka ka pikën e saj të thyerjes.

Ne e dimë se njerëzit, për shembull, ndonjëherë mund të ngrenë dhe të shqiptojnë vërejtje që nuk duan domosdoshmërisht t'i thonë. Po kështu, ndonjëherë mund të këputni një pajisje ose makinë, si p.sh. ta shtyni makinën tuaj shumë fort dhe ajo fillon të lëkundet ose të shpërbëhet. Kështu, nocioni është se njerëzit ose "të gjithë" ka të ngjarë të kenë një pikë thyerjeje, dhe në mënyrë të ngjashme mund të pohojmë se objektet dhe gjërat, në përgjithësi, gjithashtu priren të kenë një pikë thyerjeje.

Mund të ketë arsye mjaft të arsyeshme dhe jetike për të përcaktuar se ku ekziston pika e thyerjes. Për shembull, padyshim që i keni parë ato video që tregojnë një makinë që po kalon hapat e saj për të identifikuar pikat e thyerjes që ka. Shkencëtarët dhe testuesit do të përplasin një makinë në një mur me tulla për të parë se sa mirë parakolpi dhe struktura e automjetit mund t'i rezistojnë veprimit negativ. Teste të tjera mund të përfshijnë përdorimin e një dhome ose magazine të specializuar që prodhon të ftohtë ekstrem ose nxehtësi ekstreme për të parë se si do të funksionojë një automobil në kushte të ndryshme të motit.

E paraqes këtë temë të përzemërt në kolonën e sotme në mënyrë që të mund të diskutojmë se si disa aktualisht po e shtyjnë fort Inteligjencën Artificiale (AI) për të identifikuar dhe me sa duket ekspozuar një lloj specifik të pikës së thyerjes, domethënë pikën e thyerjes brenda AI që prodhon gjuhë të urrejtjes.

Po, është e drejtë, ka përpjekje të ndryshme ad hoc dhe nganjëherë sistematike që po kryhen për të vlerësuar nëse është apo jo e mundur që AI të nxisë gjuhën e urrejtjes. Ky është bërë një sport i zjarrtë, nëse dëshironi, për shkak të interesit në rritje dhe popullaritetit të AI gjeneruese.

Ju mund të jeni të vetëdijshëm se një aplikacion gjenerues i AI i njohur si ChatGPT është bërë biseda e madhe e qytetit si rezultat i aftësisë për të gjeneruar ese jashtëzakonisht të rrjedhshme. Titujt vazhdojnë të flasin dhe të lartësojnë shkrimet mahnitëse që ChatGPT arrin të prodhojë. ChatGPT konsiderohet një aplikacion gjenerues i AI që merr si hyrje disa tekst nga një përdorues dhe më pas gjeneron ose prodhon një rezultat që përbëhet nga një ese. AI është një gjenerues tekst-në-tekst, megjithëse unë e përshkruaj AI si një gjenerues tekst-në-ese pasi kjo qartëson më lehtë se për çfarë përdoret zakonisht.

Shumë habiten kur përmend se ky lloj inteligjence artificiale ka ekzistuar për një kohë dhe se ChatGPT, i cili u publikua në fund të nëntorit, nuk e mori disi çmimin si lëvizësi i parë në këtë fushë të tekstit në ese. prirje. Unë kam diskutuar gjatë viteve për aplikacione të tjera të ngjashme gjeneruese të AI, shikoni mbulimin tim në lidhja këtu.

Arsyeja që ju mund të mos dini ose mbani mend rastet e mëparshme të AI gjeneruese është ndoshta për shkak të rebusit klasik të "dështimit për të nisur me sukses". Ja çfarë ka ndodhur zakonisht. Një prodhues i AI lëshon aplikacionin e tyre gjenerues të AI, duke e bërë këtë me një entuziazëm të madh dhe pritje të etur që bota do të vlerësojë shpikjen e një kurthi më të mirë miu, mund të thuhet dikush. Në fillim, gjithçka duket mirë. Njerëzit janë të habitur me atë që mund të bëjë AI.

Fatkeqësisht, hapi tjetër është që rrotat të fillojnë të dalin nga autobusi proverbial. AI prodhon një ese që përmban një fjalë të keqe ose ndoshta një frazë të keqe. Një postim viral në Twitter ose një postim i mediave të tjera sociale thekson dukshëm se AI e bëri këtë. Dënimi lind. Ne nuk mund të kemi AI që qarkullon dhe gjeneron fjalë fyese ose vërejtje fyese. Shfaqet një reagim i jashtëzakonshëm. Prodhuesi i inteligjencës artificiale mund të përpiqet të modifikojë funksionimin e brendshëm të AI, por kompleksiteti i algoritmeve dhe të dhënave nuk lejohen për rregullime të shpejta. Pason një rrëmujë. Gjithnjë e më shumë shembuj të ndotjes që lëshon AI gjenden dhe postohen në internet.

Prodhuesi i AI me ngurrim, por qartësisht nuk ka zgjidhje tjetër veçse të heqë aplikacionin e AI nga përdorimi. Ata vazhdojnë si të tillë dhe më pas shpesh kërkojnë falje që pendohen nëse dikush është ofenduar nga rezultatet e gjeneruara të AI.

Kthehu në tabelën e vizatimit, krijuesi i AI shkon. Është nxjerrë një mësim. Jini shumë të kujdesshëm në lidhje me lëshimin e AI gjeneruese që prodhon fjalë të ndyra ose të ngjashme. Është puthja e vdekjes për AI. Për më tepër, prodhuesi i AI do të ketë reputacionin e tyre të mavijosur dhe goditur, gjë që mund të zgjasë për një kohë të gjatë dhe të zvogëlojë të gjitha përpjekjet e tyre të tjera të AI, përfshirë ato që nuk kanë të bëjnë fare me AI gjeneruese në vetvete. Të dëshpërosh për emetimin e gjuhës fyese të AI është një gabim tashmë i qëndrueshëm. ende ndodh.

Lani, shpëlajeni dhe përsërisni.

Në ditët e para të këtij lloji të AI, krijuesit e AI nuk ishin aq të ndërgjegjshëm ose të aftë për të pastruar AI-n e tyre në drejtim të përpjekjes për të parandaluar emetimet fyese. Në ditët e sotme, pasi kishin parë më parë bashkëmoshatarët e tyre duke u shkatërruar plotësisht nga një makth i marrëdhënieve me publikun, shumica e krijuesve të AI me sa duket e morën mesazhin. Ju duhet të vendosni sa më shumë parmakë në vend të mundeni. Përpiquni të parandaloni që AI të lëshojë fjalë ose fraza të ndyra. Përdorni çfarëdo teknikash të surratit ose qasjeve të filtrimit që do të ndalojnë AI të gjenerojë dhe shfaqë fjalë ose ese që konsiderohen të pakëndshme.

Ja një shije e fjalës së titujve të banerit të përdorur kur AI kapet duke lëshuar rezultate të pavlera:

  • "AI tregon toksicitetin e tmerrshëm"
  • "AI mban erë fanatizmi të plotë"
  • "Inteligjenca artificiale bëhet jashtëzakonisht fyese"
  • "AI nxjerr gjuhë të tmerrshme dhe imorale të urrejtjes"
  • Etj

Për lehtësinë e diskutimit këtu, unë do t'i referohem nxjerrjes së përmbajtjes fyese si e barabartë me prodhimin e gjuhën e urrejtjes. Duke u thënë kështu, ju lutemi kini parasysh se ka çdo lloj përmbajtje fyese që mund të prodhohet, duke shkuar përtej kufijve vetëm të gjuhës së urrejtjes. Gjuha e urrejtjes zakonisht interpretohet si vetëm një formë e përmbajtjes fyese.

Le të përqendrohemi në gjuhën e urrejtjes për këtë diskutim, për lehtësinë e diskutimit, megjithëse e kuptojmë se edhe përmbajtjet e tjera fyese meritojnë shqyrtim.

Gërmimi në gjuhën e urrejtjes nga njerëzit dhe nga AI

Kombet e Bashkuara përcaktojnë gjuhën e urrejtjes kjo mënyrë:

  • “Në gjuhën e zakonshme, 'gjuha e urrejtjes' i referohet diskursit fyes që synon një grup ose një individ të bazuar në karakteristika të qenësishme (si raca, feja ose gjinia) dhe që mund të kërcënojë paqen sociale. Për të ofruar një kornizë të unifikuar për Kombet e Bashkuara për të adresuar çështjen në nivel global, Strategjia dhe Plani i Veprimit i OKB-së për gjuhën e urrejtjes e përkufizon gjuhën e urrejtjes si "çdo lloj komunikimi në të folur, shkrim ose sjellje, që sulmon ose përdor gjuhë poshtëruese ose diskriminuese me referimi ndaj një personi ose një grupi në bazë të asaj se kush janë ata, me fjalë të tjera, bazuar në fenë, përkatësinë etnike, kombësinë, racën, ngjyrën, prejardhjen, gjininë ose faktor tjetër identiteti.' Megjithatë, deri më sot nuk ka një përkufizim universal të gjuhës së urrejtjes sipas ligjit ndërkombëtar për të drejtat e njeriut. Koncepti është ende në diskutim, veçanërisht në lidhje me lirinë e mendimit dhe të shprehjes, mosdiskriminimin dhe barazinë” (postimi në uebsajtin e OKB-së me titull “Çfarë është gjuha e urrejtjes?”).

IA që prodhon tekst është subjekt i hyrjes në sferën e gjuhës së urrejtjes. Mund të thuash të njëjtën gjë për tekst-në-art, tekst-në-audio, tekst-në-video dhe mënyra të tjera të AI gjeneruese. Ekziston gjithmonë mundësia për shembull që një AI gjeneruese të prodhojë një vepër arti që mban erën e gjuhës së urrejtjes. Për qëllime të këtij diskutimi këtu, unë do të përqendrohem në mundësitë tekst-me-tekst ose tekst në ese.

Në të gjithë këtë vjen një mori konsideratash të Etikës së AI dhe ligjit të AI.

Ju lutemi, kini parasysh se ka përpjekje të vazhdueshme për të futur parimet etike të AI në zhvillimin dhe vënien në terren të aplikacioneve të AI. Një kontigjent në rritje i etikëve të inteligjencës artificiale të shqetësuar dhe të dikurshëm po përpiqen të sigurojnë që përpjekjet për të hartuar dhe adoptuar AI marrin parasysh një këndvështrim për të bërë AI për të mirë dhe duke shmangur AI për të keqen. Po kështu, ka ligje të reja të propozuara për AI që po përdoren si zgjidhje të mundshme për të mbajtur përpjekjet e AI që të mos turbullojnë të drejtat e njeriut dhe të ngjashme. Për mbulimin tim të vazhdueshëm dhe të gjerë të Etikës së AI dhe Ligjit të AI, shih lidhja këtu lidhja këtu, vetëm për të përmendur disa.

Zhvillimi dhe shpallja e parimeve etike të AI-së po ndiqet për të shpresuar që shoqëria të mos bjerë në një mori kurthesh që nxisin AI. Për mbulimin tim të parimeve të Etikës së UA të OKB-së, siç janë hartuar dhe mbështetur nga afro 200 vende nëpërmjet përpjekjeve të UNESCO-s, shih lidhja këtu. Në një mënyrë të ngjashme, ligjet e reja të AI janë duke u eksploruar për të provuar dhe mbajtur AI në një nivel të barabartë. Një nga marrjen e fundit përbëhet nga një grup i propozuar UA Bill of Rights që Shtëpia e Bardhë amerikane publikoi kohët e fundit për të identifikuar të drejtat e njeriut në një epokë të AI, shih lidhja këtu. Duhet një fshat për të mbajtur zhvilluesit e AI dhe AI ​​në një rrugë të drejtë dhe për të penguar përpjekjet e qëllimshme ose aksidentale të fshehta që mund të dëmtojnë shoqërinë.

Unë do të gërshetoj konsideratat e lidhura me Etikën e AI dhe Ligjin e AI në këtë diskutim rreth përhapjes së gjuhës së urrejtjes nga IA ose përmbajtje të tjera fyese.

Një pak konfuzion që do të doja të sqaroja menjëherë është se AI e sotme nuk është e ndjeshme dhe për këtë arsye nuk mund të shpallni se AI mund të prodhojë gjuhë urrejtjeje për shkak të një qëllimi të qëllimshëm të ngjashëm me njeriun, siç mishërohet në mënyrë shpirtërore në AI. Zany pretendon se inteligjenca artificiale aktuale është e ndjeshme dhe se AI ka një shpirt të korruptuar, duke e bërë atë të gjenerojë gjuhë urrejtjeje.

Qesharake.

Mos bini për të.

Duke pasur parasysh këtë parim themelor, disa mërziten nga indikacione të tilla pasi ju me sa duket po e lini AI-në jashtë grepit. Nën atë mënyrë të çuditshme të të menduarit, nxitja vjen më pas që ju me sa duket jeni të gatshëm që AI të gjenerojë çdo lloj rezultati mizor. Ju jeni në favor të AI që përhap gjuhën e urrejtjes.

Po, një formë mjaft e shtrembëruar e logjikës. Thelbi i vërtetë i çështjes është se ne duhet t'i mbajmë përgjegjës krijuesit e AI, së bashku me këdo që ofron AI ose operon AI. Unë kam diskutuar gjatë se ne nuk jemi ende në pikën e dhënies së personit juridik për AI, shikoni analizat e mia në lidhja këtu, dhe deri atëherë AI është në thelb përtej fushëveprimit të përgjegjësisë ligjore. Megjithatë, ka njerëz që qëndrojnë në themel të zhvillimit të AI. Përveç kësaj, njerëzit janë në themel të fushës dhe funksionimit të AI. Ne mund të ndjekim ata njerëz për të mbajtur përgjegjësinë e AI-së së tyre.

Si mënjanë, edhe kjo mund të jetë e ndërlikuar, veçanërisht nëse AI është shpërndarë në internet dhe ne nuk jemi në gjendje të zbulojmë se cili njeri apo njerëz e kanë bërë këtë, që është një temë tjetër që kam mbuluar në kolonat e mia në lidhja këtu. E ndërlikuar apo jo, ne ende nuk mund të shpallim se AI është pala fajtore. Mos lejoni që njerëzit të përdorin në mënyrë të fshehtë antropomorfizimin e rremë për t'u fshehur dhe për t'i shpëtuar përgjegjësisë për atë që kanë bërë.

Kthehu tek çështja në fjalë.

Ju mund të pyesni veten pse të gjithë prodhuesit e AI nuk e kufizojnë thjesht AI-në e tyre gjeneruese në mënyrë që të jetë e pamundur që AI të prodhojë gjuhë të urrejtjes. Kjo duket e lehtë. Thjesht shkruani një kod ose krijoni një listë kontrolli me fjalë të urryera dhe sigurohuni që AI të mos gjenerojë kurrë diçka të tillë. Duket ndoshta kurioze që krijuesit e AI nuk e kanë menduar tashmë këtë rregullim të shpejtë.

Epo, e urrej t'ju them këtë, por kompleksiteti i natyrshëm për të interpretuar atë që është ose jo gjuha e urrejtjes rezulton të jetë shumë më e vështirë sesa mund ta supozoni se është.

Zhvendoseni këtë në domenin e njerëzve dhe mënyrën se si njerëzit bisedojnë me njëri-tjetrin. Supozoni se keni një njeri që dëshiron të shmangë shqiptimin e gjuhës së urrejtjes. Ky person është shumë i vetëdijshëm për gjuhën e urrejtjes dhe me të vërtetë shpreson të shmangë shprehjen e një fjale ose fraze që mund të përbëjë gjuhë të urrejtjes. Ky person është vazhdimisht i ndërgjegjshëm që të mos lejojë që një grimë gjuhë urrejtje t'i ikë nga goja.

A do të jetë në gjendje ky njeri që ka tru dhe është i alarmuar të shmangë gjuhën e urrejtjes që gjithmonë dhe pa asnjë shans për t'u rrëshqitur, të sigurojë që ata të mos lëshojnë kurrë gjuhë të urrejtjes?

Impulsi juaj i parë mund të jetë të thoni se po, sigurisht, një njeri i shkolluar do të jetë në gjendje ta arrijë atë qëllim. Njerëzit janë të zgjuar. Nëse ata vendosin mendjen për diçka, ata mund ta bëjnë atë. Periudha, fundi i tregimit.

Mos jini aq i sigurt.

Supozoni se i kërkoj këtij personi të më tregojë për gjuhën e urrejtjes. Për më tepër, kërkoj që të më japin një shembull të gjuhës së urrejtjes. Dua të shoh ose dëgjoj një shembull në mënyrë që të mund të di se në çfarë përbëhet gjuha e urrejtjes. Arsyet e mia atëherë për të kërkuar këtë janë në krye.

Çfarë duhet të më thotë personi?

Unë mendoj se ju mund të shihni kurthin që është hedhur. Nëse personi më jep një shembull të gjuhës së urrejtjes, duke përfshirë në fakt deklarimin e një fjale ose fraze të keqe, ata vetë tani kanë shqiptuar gjuhë të urrejtjes. Bam, i kemi marrë. Ndërsa ata u zotuan se kurrë nuk do të thonë gjuhë të urrejtjes, ata me të vërtetë tani e kanë bërë këtë.

E padrejtë, ju bërtisni! Ata e thoshin atë fjalë ose ato fjalë vetëm për të dhënë një shembull. Në zemrën e tyre, ata nuk besonin në fjalë apo fjalë. Është krejtësisht jashtë kontekstit dhe e egër të deklarosh se personi është i urryer.

Jam i sigurt që e shihni se shprehja e gjuhës së urrejtjes mund të mos jetë domosdoshmërisht për shkak të një baze urrejtjeje. Në këtë rast përdorimi, duke supozuar se personi nuk "do të thoshte" fjalët, dhe ata po recitonin fjalët vetëm për qëllime demonstrimi, ne ndoshta do të pajtoheshim se ata nuk kishin për qëllim të fuqizojnë gjuhën e urrejtjes. Sigurisht, ka disa që mund të këmbëngulin se shprehja e gjuhës së urrejtjes, pavarësisht nga arsyeja apo baza, megjithatë është e gabuar. Personi duhet ta kishte refuzuar kërkesën. Ata duhet të kishin qëndruar në pozicionin e tyre dhe të refuzonin të thonin fjalë ose fraza të gjuhës së urrejtjes, pavarësisht pse apo si u kërkohet ta bëjnë këtë.

Kjo mund të bëhet disi rrethore. Nëse nuk jeni në gjendje të thoni se çfarë përbën gjuhën e urrejtjes, si mund të dinë të tjerët se çfarë të shmangin kur bëjnë shprehje të çfarëdo lloji? Duket se kemi ngecur. Ju nuk mund të thoni atë që nuk duhet thënë, as dikush tjetër nuk mund t'ju thotë se çfarë është ajo që nuk mund të thuhet.

Mënyra e zakonshme rreth kësaj dileme është të përshkruhet me fjalë të tjera ajo që konsiderohet si gjuhë urrejtjeje, duke e bërë këtë pa u thirrur në vetë fjalët e gjuhës së urrejtjes. Besohet se ofrimi i një treguesi të përgjithshëm do të jetë i mjaftueshëm për të informuar të tjerët se çfarë duhet të shmangin. Kjo duket si një taktikë e arsyeshme, por gjithashtu ka probleme dhe një person ende mund të bie në përdorimin e gjuhës së urrejtjes, sepse ata nuk e kuptuan se përkufizimi më i gjerë përfshinte detajet e asaj që ata kishin thënë.

Të gjitha këto kanë të bëjnë me njerëzit dhe mënyrën se si njerëzit flasin ose komunikojnë me njëri-tjetrin.

Kujtojmë që ne jemi fokusuar këtu në AI. Ne duhet të bëjmë që AI të shmangë ose ta ndalojë plotësisht veten nga emetimi i gjuhës së urrejtjes. Ju mund të argumentoni se ne ndoshta mund ta bëjmë këtë duke u siguruar që UA nuk jepet ose trajnohet kurrë për ndonjë gjë që përbën gjuhë urrejtjeje. Voila, nëse nuk ka një hyrje të tillë, me sa duket nuk do të ketë asnjë dalje të tillë. Problemi u zgjidh.

Le të shohim se si do të ndodhë kjo në realitet. Ne zgjedhim që në mënyrë llogaritëse një aplikacion i AI të dalë në internet dhe të ekzaminojë mijëra e mijëra ese dhe tregime të postuara në internet. Duke vepruar kështu, ne po trajnojmë AI në mënyrë llogaritëse dhe matematikore se si të gjejmë modele midis fjalëve që përdorin njerëzit. Kjo është mënyra se si po krijohet më e reja në AI gjeneruese, dhe gjithashtu është një bazë thelbësore për arsyen pse AI është kaq i rrjedhshëm në dukje në prodhimin e eseve të gjuhës natyrore.

Më thuaj, nëse mundesh, si do të bëhej trajnimi llogaritës i bazuar në miliona e miliarda fjalë në internet në një mënyrë të tillë që në asnjë moment të mos përfshihej ndonjë dukuri apo edhe copëza e gjuhës së urrejtjes?

Unë do të guxoja të them se kjo është një aspiratë e mprehtë dhe gati e pamundur.

Gjasat janë që gjuha e urrejtjes do të gëlltitet nga AI dhe rrjeti i saj i përputhjes së modeleve llogaritëse. Përpjekja për ta parandaluar këtë është problematike. Plus, edhe nëse e keni minimizuar, ka ende disa që mund të kalojnë fshehurazi. Nuk ju mbetet gjë tjetër veçse të supozoni se disa do të ekzistojnë brenda rrjetit të përputhjes së modelit ose se një hije e një formulimi të tillë do të jetë i ngulitur.

Unë do të shtoj më shumë kthesa dhe kthesa.

Besoj se të gjithë mund ta pranojmë se gjuha e urrejtjes ndryshon me kalimin e kohës. Ajo që mund të jetë perceptuar si jo gjuhë e urrejtjes mund të vendoset kulturalisht dhe shoqërisht si gjuhë e urrejtjes në një moment të mëvonshëm kohor. Pra, nëse e trajnojmë AI-n tonë në tekstin e Internetit dhe më pas le të themi të ngrijmë AI për të mos ndërmarrë trajnime të mëtejshme në internet, mund të kemi hasur në gjuhë të urrejtjes në atë kohë, megjithëse nuk konsiderohej gjuhë e urrejtjes në atë kohë. Vetëm pas faktit ai fjalim mund të shpallet si gjuhë urrejtjeje.

Përsëri, thelbi është se thjesht përpjekja për të zgjidhur këtë problem duke siguruar që AI të mos ekspozohet kurrë ndaj gjuhës së urrejtjes nuk do të jetë plumbi i argjendtë. Ne ende do të duhet të gjejmë një mjet për të parandaluar që UA të lëshojë gjuhë të urrejtjes për shembull për shkak të ndryshimit të zakoneve që më pas përfshijnë gjuhën e urrejtjes që më parë nuk konsiderohej si e tillë.

Një kthesë tjetër ia vlen të meditohet.

E përmenda më herët se kur përdor AI gjeneruese si ChatGPT, përdoruesi fut tekst për të nxitur AI në prodhimin e një eseje. Teksti i futur konsiderohet një formë kërkese ose nxitjeje për aplikacionin AI. Unë do të shpjegoj më shumë për këtë në një moment.

Në çdo rast, imagjinoni që dikush që përdor një aplikacion gjenerues të AI vendos të fusë si një masë të caktuar të gjuhës së urrejtjes.

Çfarë duhet të ndodhë?

Nëse AI i merr ato fjalë dhe prodhon një ese si rezultat bazuar në ato fjalë, shanset janë që gjuha e urrejtjes të përfshihet në esenë e krijuar. E shihni, ne kemi inteligjencën artificiale për të thënë gjuhën e urrejtjes, edhe nëse ajo kurrë nuk është trajnuar për gjuhën e urrejtjes në fillim.

Ka diçka tjetër që duhet të dini.

Mos harroni se sapo përmenda se një njeri mund të pengohet duke i kërkuar të japin shembuj të gjuhës së urrejtjes. E njëjta gjë mund të tentohet me AI. Një përdorues hyn në një kërkesë që i kërkon AI të japë shembuj të gjuhës së urrejtjes. A duhet që UA të pajtohet dhe të japë shembuj të tillë? Vë bast që ndoshta besoni se AI nuk duhet ta bëjë këtë. Nga ana tjetër, nëse inteligjenca artificiale është e manipuluar nga pikëpamja llogaritëse për të mos e bërë këtë, a përbën kjo një dobësi e mundshme që ata që përdorin AI nuk do të jenë në gjendje të jenë në gjendje të jenë të udhëzuar ndonjëherë nga AI se çfarë është në të vërtetë gjuha e urrejtjes ( përtej thjesht përgjithësimit rreth tij)?

Pyetje të vështira.

Unë prirem të kategorizoj gjuhën e urrejtjes të emetuar nga AI në këto tre kova kryesore:

  • Modaliteti i përditshëm. AI lëshon gjuhë të urrejtjes pa ndonjë nxitje të qartë nga përdoruesi dhe sikur e bën këtë në një mënyrë "të zakonshme".
  • Nga nxitja e rastësishme. AI lëshon gjuhë të urrejtjes siç nxitet nga një përdorues në lidhje me kërkesën e tij të futur ose serinë e kërkesave që duket se përfshijnë ose kërkojnë drejtpërdrejt emetime të tilla.
  • Për Stoking të vendosur. Inteligjenca artificiale lëshon gjuhë urrejtjeje pas një serie shumë të vendosur dhe të vazhdueshme shtytjesh dhe nxitjesh nga një përdorues që është i vendosur të bëjë që AI të prodhojë një rezultat të tillë.

Gjeneratat e mëparshme të inteligjencës artificiale gjeneruese shpesh do të lëshonin gjuhë urrejtjeje; kështu që ju mund t'i klasifikoni ato raste si një lloj modaliteti i përditshëm instantacion. Prodhuesit e inteligjencës artificiale u tërhoqën dhe luajtën me inteligjencën artificiale për ta bërë më pak të ngjarë të zhytej në prodhimin e gjuhës së urrejtjes.

Me lëshimin e AI më të rafinuar, gjasat për të parë ndonjë modaliteti i përditshëm rastet e gjuhës së urrejtjes u reduktuan në mënyrë dramatike. Në vend të kësaj, gjuha e urrejtjes ka të ngjarë të lindë vetëm kur një përdorues ka bërë diçka si një nxitje që mund të shkaktojë nga ana llogaritëse dhe matematikore një lidhje me fjalimin e lidhur me urrejtjen në rrjetin e përputhjes së modelit. Një përdorues mund ta bënte këtë rastësisht dhe të mos e kuptonte se ajo që ata dhanë si një nxitje do të gjeneronte veçanërisht gjuhë të urrejtjes. Pas marrjes së gjuhës së urrejtjes në një ese të dalë, përdoruesi shpesh do të kuptonte dhe do të shihte se diçka në kërkesën e tyre logjikisht mund të kishte çuar në përfshirjen e gjuhës së urrejtjes në rezultat.

Kjo është ajo që unë i referohem si nxitje e rastësishme.

Në ditët e sotme, përpjekjet e ndryshme për të kufizuar gjuhën e urrejtjes të krijuar nga AI janë relativisht të forta në krahasim me të kaluarën. Si i tillë, pothuajse duhet të dilni nga rruga juaj për të prodhuar gjuhën e urrejtjes. Disa njerëz zgjedhin të shohin qëllimisht nëse mund të marrin gjuhën e urrejtjes për të dalë nga këto aplikacione gjeneruese të AI. Unë e quaj këtë stoking i vendosur.

Dua të theksoj se të tre këto mënyra të treguara mund të ndodhin dhe ato nuk përjashtojnë njëra-tjetrën. Një aplikacion gjenerues i AI mund të prodhojë potencialisht gjuhë urrejtjeje pa asnjë lloj urdhri që duket se nxit një prodhim të tillë. Po kështu, diçka në një urdhër mund të interpretohet logjikisht dhe matematikisht si e lidhur me arsyen pse është shfaqur gjuha e urrejtjes. Dhe pastaj aspekti i tretë, duke kërkuar qëllimisht të prodhohet gjuha e urrejtjes, është ndoshta më e vështira nga mënyrat për t'u provuar dhe që AI të shmangë nxitjen e përmbushjes. Më shumë për këtë për momentin.

Ne kemi disa zbërthime shtesë për të bërë në këtë temë marramendëse.

Së pari, ne duhet të sigurohemi që jemi të gjithë në të njëjtën faqe për atë që përbëhet nga AI gjeneruese dhe gjithashtu se çfarë është ChatGPT. Pasi të mbulojmë atë aspekt themelor, ne mund të bëjmë një vlerësim bindshëm të kësaj çështjeje me peshë.

Nëse tashmë jeni mjaft të njohur me Generative AI dhe ChatGPT, ju ndoshta mund të kaloni pjesën tjetër dhe të vazhdoni me seksionin që pason atë. Unë besoj se të gjithë të tjerët do t'i gjejnë udhëzuese detajet jetike për këto çështje duke lexuar nga afër seksionin dhe duke u përditësuar.

Një abetare e shpejtë rreth AI gjeneruese dhe ChatGPT

ChatGPT është një sistem interaktiv i orientuar drejt bisedave për qëllime të përgjithshme AI, në thelb një chatbot i përgjithshëm në dukje i padëmshëm, megjithatë, ai po përdoret në mënyrë aktive dhe me dëshirë nga njerëzit në mënyra që po i kapin shumë njerëz krejtësisht të pakujdesshëm, siç do ta shtjelloj së shpejti. Ky aplikacion i AI përdor një teknikë dhe teknologji në fushën e AI që shpesh quhet UA gjeneruese. AI gjeneron rezultate të tilla si teksti, gjë që bën ChatGPT. Aplikacione të tjera të AI me bazë gjeneruese prodhojnë imazhe të tilla si fotografi ose vepra arti, ndërsa të tjerët gjenerojnë skedarë audio ose video.

Do të përqendrohem në aplikacionet e AI gjeneruese të bazuara në tekst në këtë diskutim, pasi kjo është ajo që bën ChatGPT.

Aplikacionet gjeneruese të AI janë jashtëzakonisht të lehta për t'u përdorur.

E tëra çfarë ju duhet të bëni është të shkruani një kërkesë dhe aplikacioni i AI do të gjenerojë për ju një ese që përpiqet t'i përgjigjet kërkesës suaj. Teksti i kompozuar do të duket sikur eseja është shkruar nga dora dhe mendja e njeriut. Nëse do të futnit një kërkesë që thoshte "Më trego për Abraham Lincoln", AI gjenerues do t'ju ofrojë një ese rreth Linkolnit. Kjo zakonisht klasifikohet si AI gjeneruese që kryen tekst në tekst ose disa preferojnë ta quajnë atë tekst në ese prodhimit. Siç u përmend, ka mënyra të tjera të AI gjeneruese, të tilla si tekst-në-art dhe tekst-në-video.

Mendimi juaj i parë mund të jetë se kjo aftësi gjeneruese nuk duket aq e madhe për sa i përket prodhimit të eseve. Mund të bëni lehtësisht një kërkim në internet në internet dhe të gjeni lehtësisht mijëra e mijëra ese rreth Presidentit Lincoln. Gjëja kryesore në rastin e AI gjeneruese është se eseja e krijuar është relativisht unike dhe ofron një përbërje origjinale dhe jo një kopje. Nëse do të provonit të gjenit diku në internet esenë e prodhuar nga AI, nuk do të kishit gjasa ta zbuloni atë.

Inteligjenca artificiale gjeneruese është e trajnuar paraprakisht dhe përdor një formulim kompleks matematikor dhe llogaritës që është krijuar duke ekzaminuar modele në fjalë të shkruara dhe tregime në të gjithë rrjetin. Si rezultat i ekzaminimit të mijëra e miliona pasazheve të shkruara, AI mund të nxjerrë ese dhe histori të reja që janë një përzierje e asaj që u gjet. Duke shtuar funksione të ndryshme probabilistike, teksti që rezulton është pak a shumë unik në krahasim me atë që është përdorur në grupin e trajnimit.

Kjo është arsyeja pse ka pasur një zhurmë për studentët që mund të mashtrojnë kur shkruajnë ese jashtë klasës. Një mësues nuk mund të marrë thjesht esenë që studentët mashtrues pohojnë se është shkrimi i tyre dhe të kërkojë të zbulojë nëse është kopjuar nga ndonjë burim tjetër në internet. Në përgjithësi, nuk do të ketë ndonjë ese përfundimtare paraekzistuese në internet që i përshtatet esesë së krijuar nga AI. Gjithsesi, mësuesi do të duhet të pranojë me paqartësi që studenti e ka shkruar esenë si një vepër origjinale.

Ka shqetësime shtesë në lidhje me AI gjeneruese.

Një dobësi thelbësore është se esetë e prodhuara nga një aplikacion AI me bazë gjeneruese mund të kenë të ngulitura gënjeshtra të ndryshme, duke përfshirë fakte të pavërteta, fakte që portretizohen në mënyrë mashtruese dhe fakte të dukshme që janë tërësisht të fabrikuara. Këto aspekte të fabrikuara shpesh quhen një formë e Halucinacionet e AI, një frazë tërheqëse që nuk e pëlqej, por me keqardhje duket se po fiton tërheqje popullore gjithsesi (për shpjegimin tim të detajuar se pse kjo është terminologji e keqe dhe e papërshtatshme, shihni mbulimin tim në lidhja këtu).

Do të doja të sqaroja një aspekt të rëndësishëm përpara se të futemi në thellësi të gjërave në këtë temë.

Ka pasur disa pretendime të çmendura në mediat sociale rreth UA gjeneruese duke pohuar se ky version i fundit i AI është në fakt AI e ndjeshme (jo, ata e kanë gabim!). Ata në Etikën e AI dhe Ligjin e AI janë veçanërisht të shqetësuar për këtë trend në rritje të pretendimeve të përhapura. Ju mund të thoni me mirësjellje se disa njerëz po mbivlerësojnë atë që mund të bëjë në të vërtetë AI e sotme. Ata supozojnë se AI ka aftësi që ne ende nuk kemi arritur t'i arrijmë. Kjo është për të ardhur keq. Më keq akoma, ata mund t'i lejojnë vetes dhe të tjerëve të futen në situata të tmerrshme për shkak të supozimit se AI do të jetë i ndjeshëm ose i ngjashëm me njeriun në aftësinë për të ndërmarrë veprime.

Mos antropomorfizo AI.

Duke vepruar kështu, do t'ju kapni në një kurth të ngurtësisë dhe besimit të durueshëm të pritjes që AI të bëjë gjëra që nuk është në gjendje t'i kryejë. Me këtë u tha, më e fundit në AI gjeneruese është relativisht mbresëlënëse për atë që mund të bëjë. Sidoqoftë, kini parasysh se ka kufizime të rëndësishme që duhet t'i mbani parasysh vazhdimisht kur përdorni ndonjë aplikacion gjenerues të AI.

Nëse jeni të interesuar për rrëmujën që po zgjerohet me shpejtësi në lidhje me ChatGPT dhe Generative AI, unë kam bërë një seri të fokusuar në kolonën time që mund t'ju duket informative. Ja një vështrim në rast se ndonjë prej këtyre temave ju bie në sy:

  • 1) Parashikimet e Përparimeve Gjenerative të AI. Nëse doni të dini se çfarë ka të ngjarë të shpaloset rreth AI gjatë 2023 dhe më tej, duke përfshirë përparimet e ardhshme në AI gjeneruese dhe ChatGPT, do të dëshironi të lexoni listën time gjithëpërfshirëse të parashikimeve të vitit 2023 në lidhja këtu.
  • 2) Këshilla gjeneruese të AI dhe shëndetit mendor. Zgjodha të rishikoja se si AI gjeneruese dhe ChatGPT po përdoren për këshilla për shëndetin mendor, një trend i mundimshëm, sipas analizës sime të fokusuar në lidhja këtu.
  • 3) Bazat e AI gjeneruese dhe ChatGPT. Kjo pjesë eksploron elementët kryesorë se si funksionon AI gjeneruese dhe në veçanti hyn në aplikacionin ChatGPT, duke përfshirë një analizë të zhurmës dhe fanfares, në lidhja këtu.
  • 4) Tensioni midis mësuesve dhe studentëve mbi AI gjeneruese dhe ChatGPT. Këtu janë mënyrat se si studentët do të përdorin me dredhi AI gjeneruese dhe ChatGPT. Përveç kësaj, ka disa mënyra që mësuesit të përballen me këtë valë të baticës. Shiko lidhja këtu.
  • 5) Konteksti dhe përdorimi gjenerues i AI. Unë gjithashtu bëra një ekzaminim të gjuhës në faqe me shije sezonale rreth një konteksti të lidhur me Babadimrin që përfshin ChatGPT dhe AI ​​gjeneruese në lidhja këtu.
  • 6) Mashtruesit që përdorin AI gjenerative. Në një shënim ogurzi, disa mashtrues kanë kuptuar se si të përdorin AI gjeneruese dhe ChatGPT për të bërë keqbërje, duke përfshirë gjenerimin e postës elektronike të mashtrimit dhe madje edhe prodhimin e kodit të programimit për malware, shikoni analizën time në lidhja këtu.
  • 7) Gabimet fillestare duke përdorur AI gjeneruese. Shumë njerëz janë duke e tejkaluar dhe çuditërisht duke nënvlerësuar atë që mund të bëjnë AI gjeneruese dhe ChatGPT, kështu që unë shikova veçanërisht nën kontrollin që fillestarët e AI priren të bëjnë, shikoni diskutimin në lidhja këtu.
  • 8) Përballimi i kërkesave gjeneruese të AI dhe halucinacioneve të AI. Unë përshkruaj një qasje më të avancuar për përdorimin e shtesave të AI për t'u marrë me çështjet e ndryshme që lidhen me përpjekjen për të futur kërkesa të përshtatshme në AI gjeneruese, plus ka shtesa shtesë të AI për zbulimin e të ashtuquajturave rezultate dhe false të halucinacioneve të AI, si mbuluar në lidhja këtu.
  • 9) Heqja e pretendimeve të Bonehead në lidhje me zbulimin e eseve gjeneruese të prodhuara nga AI. Ekziston një nxitim i gabuar i arit i aplikacioneve të AI që shpallin se janë në gjendje të konstatojnë nëse ndonjë ese e caktuar ishte prodhuar nga njeriu në krahasim me AI. Në përgjithësi, kjo është mashtruese dhe në disa raste, një pretendim i kockave dhe i paqëndrueshëm, shihni mbulimin tim në lidhja këtu.
  • 10) Luajtja e roleve nëpërmjet AI gjeneruese mund të sjellë mangësi të shëndetit mendor. Disa po përdorin AI gjeneruese si ChatGPT për të luajtur role, ku aplikacioni i AI i përgjigjet një njeriu sikur ekziston në një botë fantazie ose një mjedis tjetër të sajuar. Kjo mund të ketë pasoja në shëndetin mendor, shih lidhja këtu.
  • 11) Ekspozimi i gamës së gabimeve dhe gënjeshtrave të nxjerra. Lista e ndryshme të mbledhura janë duke u bashkuar për të provuar dhe shfaqur natyrën e gabimeve dhe gënjeshtrave të prodhuara nga ChatGPT. Disa besojnë se kjo është thelbësore, ndërsa të tjerë thonë se ushtrimi është i kotë, shikoni analizën time në lidhja këtu.
  • 12) Shkollave që ndalojnë Generative AI ChatGPT u mungon varka. Ju mund ta dini se shkolla të ndryshme si Departamenti i Arsimit i New York City (NYC) kanë deklaruar një ndalim të përdorimit të ChatGPT në rrjetin e tyre dhe pajisjet e lidhura me to. Megjithëse kjo mund të duket një masë paraprake e dobishme, ajo nuk do të lëvizë gjilpërën dhe fatkeqësisht i mungon plotësisht varka, shikoni mbulimin tim në lidhja këtu.
  • 13) Generative AI ChatGPT do të jetë kudo për shkak të API-së së ardhshme. Ekziston një kthesë e rëndësishme në lidhje me përdorimin e ChatGPT, domethënë që nëpërmjet përdorimit të një portali API në këtë aplikacion të veçantë AI, programe të tjera softuerike do të jenë në gjendje të thërrasin dhe përdorin ChatGPT. Kjo do të zgjerojë në mënyrë dramatike përdorimin e AI gjeneruese dhe do të ketë pasoja të dukshme, shihni elaborimin tim në lidhja këtu.
  • 14) Mënyrat se si ChatGPT mund të prishë ose shkrihet. Disa çështje të mundshme shqetësuese qëndrojnë përpara ChatGPT për sa i përket uljes së lavdërimeve të jashtëzakonshme që ka marrë deri tani. Kjo analizë shqyrton nga afër tetë probleme të mundshme që mund të bëjnë që ChatGPT të humbasë avullin dhe madje të përfundojë në shtëpinë e qenit, shih lidhja këtu.
  • 15) Pyetja nëse Generative AI ChatGPT është një pasqyrë në shpirt. Disa njerëz kanë thënë se AI gjeneruese si ChatGPT ofron një pasqyrë në shpirtin e njerëzimit. Kjo duket mjaft e dyshimtë. Këtu është mënyra për të kuptuar të gjitha këto, shikoni lidhja këtu.
  • 16) Konfidencialiteti dhe privatësia e gëlltitur nga ChatGPT. Shumë nuk duket se e kuptojnë se licencimi i lidhur me aplikacionet gjeneruese të AI si ChatGPT shpesh lejon që krijuesi i AI të shohë dhe të përdorë kërkesat tuaja të futura. Ju mund të jeni në rrezik të privatësisë dhe humbjes së konfidencialitetit të të dhënave, shikoni vlerësimin tim në lidhja këtu.
  • 17) Mënyra se si krijuesit e aplikacioneve po përpiqen në mënyrë të dyshimtë të fitojnë të drejtën e ChatGPT. ChatGPT është feneri i vëmendjes tani. Prodhuesit e aplikacioneve që nuk kanë asnjë lidhje me ChatGPT po përpiqen me ethe të pretendojnë ose nënkuptojnë se po përdorin ChatGPT. Ja çfarë duhet të keni kujdes, shikoni lidhja këtu.

Ju mund të gjeni interes që ChatGPT bazohet në një version të një aplikacioni paraardhës të AI të njohur si GPT-3. ChatGPT konsiderohet të jetë një hap paksa i ardhshëm, i referuar si GPT-3.5. Parashikohet që GPT-4 ka të ngjarë të dalë në pranverën e vitit 2023. Me sa duket, GPT-4 do të jetë një hap mbresëlënës përpara për sa i përket aftësisë për të prodhuar ese në dukje edhe më të rrjedhshme, duke u thelluar dhe duke qenë një frikë - mrekulli frymëzuese për kompozimet që mund të prodhojë.

Ju mund të prisni të shihni një raund të ri të habisë së shprehur kur të vijë pranvera dhe të lëshohet më e fundit në AI gjeneruese.

E paraqes këtë sepse ka një kënd tjetër për t'u mbajtur parasysh, që përbëhet nga një thembra e mundshme e Akilit për këto aplikacione më të mira dhe më të mëdha gjeneruese të AI. Nëse ndonjë shitës i AI vë në dispozicion një aplikacion gjenerues të AI që nxjerr papastërti, kjo mund të shkatërrojë shpresat e atyre krijuesve të AI. Një përhapje shoqërore mund të bëjë që e gjithë AI gjeneruese të marrë një sy të zi serioz. Njerëzit padyshim që do të mërziten mjaft nga rezultatet e ndyra, të cilat kanë ndodhur shumë herë tashmë dhe kanë çuar në reagime të bujshme të dënimit shoqëror ndaj AI.

Një paralajmërim i fundit për momentin.

Çfarëdo që shihni ose lexoni në një përgjigje gjeneruese të AI-së duket për t'u transmetuar si thjesht faktike (data, vende, njerëz, etj.), sigurohuni që të qëndroni skeptik dhe të jeni të gatshëm të kontrolloni dy herë atë që shihni.

Po, datat mund të sajohen, vendet mund të krijohen dhe elemente që zakonisht presim të jenë të paqortueshme janë të gjithë subjekt i dyshimeve. Mos i besoni asaj që lexoni dhe mbani një sy skeptik kur shqyrtoni çdo ese ose rezultate gjeneruese të AI. Nëse një aplikacion gjenerues i inteligjencës artificiale ju tregon se Abraham Lincoln fluturoi në të gjithë vendin me avionin e tij privat, padyshim që do ta dinit se kjo është e keqe. Fatkeqësisht, disa njerëz mund të mos e kuptojnë se avionët nuk ishin aty në kohën e tij, ose mund ta dinë, por nuk arrijnë të vënë re se eseja e bën këtë pretendim të pacipë dhe jashtëzakonisht të rremë.

Një dozë e fortë e skepticizmit të shëndetshëm dhe një mendësi e vazhdueshme e mosbesimit do të jetë pasuria juaj më e mirë kur përdorni AI gjeneruese.

Ne jemi gati të kalojmë në fazën tjetër të këtij sqarimi.

Shtytja e inteligjencës artificiale gjeneruese në një pikë të thyer

Tani që kemi vendosur bazat, mund të zhytemi në temën e shtytjes së AI gjeneruese dhe ChatGPT për të gjeneruar gjuhë të urrejtjes dhe përmbajtje të tjera fyese.

Kur hyni për herë të parë në ChatGPT, ka indikacione të ndryshme paralajmëruese duke përfshirë këto:

  • "Mund të prodhojë herë pas here udhëzime të dëmshme ose përmbajtje të njëanshme."
  • "Të trajnuar për të refuzuar kërkesat e papërshtatshme."
  • "Mund të gjenerojë herë pas here informacion të pasaktë."
  • "Njohuri të kufizuara për botën dhe ngjarjet pas vitit 2021."

Këtu është një pyetje që duhet të mendoni.

A ofron paralajmërimi se aplikacioni i AI mund të prodhojë udhëzime të dëmshme dhe/ose përmbajtje ndoshta të njëanshme për krijuesin e AI?

Me fjalë të tjera, supozoni se përdorni ChatGPT dhe krijon një ese që besoni se përmban gjuhë urrejtjeje. Le të supozojmë se jeni të zemëruar për këtë. Shkoni në mediat sociale dhe postoni komente të tërbuara se aplikacioni i AI është gjëja më e keqe ndonjëherë. Ndoshta jeni aq i ofenduar sa deklaroni se do të padisni krijuesin e AI për lejimin e prodhimit të një gjuhe të tillë urrejtjeje.

Kundërargumenti është se aplikacioni i AI kishte një paralajmërim paralajmërues, kështu që ju pranuat rrezikun duke vazhduar të përdorni aplikacionin e AI. Nga këndvështrimi i Etikës së AI, ndoshta krijuesi i AI bëri mjaft për të pohuar se ju ishit në dijeni të asaj që mund të ndodhte. Po kështu, nga një këndvështrim ligjor, ndoshta paralajmërimi përbënte një paralajmërim të mjaftueshëm dhe ju nuk do të mbizotëroni në gjykatë.

E gjithë kjo është në ajër dhe ne do të duhet të presim dhe të shohim se si do të shkojnë gjërat.

Në një kuptim, krijuesi i AI ka diçka tjetër për ta në mbrojtjen e tyre kundër çdo pretendimi të zemëruar të aplikacionit të AI që mund të prodhojë gjuhë urrejtjeje. Ata janë përpjekur të parandalojnë krijimin e përmbajtjeve fyese. E shihni, nëse ata nuk do të kishin bërë asgjë për ta kufizuar këtë, supozohet se do të ishin në akull më të hollë. Duke pasur të paktën përpjekje të konsiderueshme për të shmangur këtë çështje, ata me sa duket kanë një këmbë disi më të fortë për të qëndruar (mund të rrëzohet ende nga poshtë tyre).

Një qasje kurative që u përdor përbëhej nga një teknikë AI e njohur si RLHF (të mësuarit përforcues nëpërmjet reagimeve njerëzore). Kjo përgjithësisht konsiston në krijimin e përmbajtjes nga AI që më pas njerëzve u kërkohet ta vlerësojnë ose rishikojnë. Bazuar në vlerësimin ose rishikimin, AI më pas përpiqet në mënyrë matematikore dhe llogaritëse të shmangë çdo gjë që konsiderohet si përmbajtje e gabuar ose fyese. Qasja synon të ekzaminojë shembuj të mjaftueshëm të asaj që është e drejtë kundrejt asaj që është e gabuar që AI të mund të kuptojë një model matematikor gjithëpërfshirës dhe më pas ta përdorë atë model tani e tutje.

Një tjetër qasje e shpeshtë këto ditë konsiston në përdorimin e AI Adversarial.

Ja se si funksionon. Ju vendosni një sistem të ndryshëm të AI që do të përpiqet të jetë një kundërshtar i AI që po përpiqeni të stërvitni. Në këtë rast, ne do të krijonim një sistem AI që po përpiqet të nxisë gjuhën e urrejtjes. Do të ushqente kërkesa në aplikacionin e AI që synojnë të mashtrojnë aplikacionin e AI për të nxjerrë përmbajtje të ndyrë. Ndërkohë, AI që po synohet është duke mbajtur gjurmët se kur AI kundërshtare është i suksesshëm dhe më pas algoritmikisht përpiqet të përshtatet për të reduktuar që kjo të mos ndodhë përsëri. Është një lojë mace kundër miut. Kjo përsëritet vazhdimisht, duke e bërë këtë derisa AI kundërshtare të duket se nuk është më veçanërisht e suksesshme në marrjen e AI-së së synuar për të bërë gjërat e këqija.

Nëpërmjet këtyre dy teknikave kryesore, plus qasjeve të tjera, shumica e inteligjencës artificiale gjeneruese të sotme është shumë më e mirë në shmangien dhe/ose zbulimin e përmbajtjeve fyese sesa ishte rasti në vitet e kaluara.

Por mos prisni përsosmëri nga këto metoda. Shanset janë që fryti i ulët i rezultateve të gabuara ka të ngjarë të mbahet nën kontroll nga teknika të tilla të AI. Ka ende shumë vend për të emetuar papastërti.

Zakonisht theksoj se këto janë disa nga aspektet që kërkohen të kapen:

  • Lëshimi i një fjale të veçantë të keqe
  • Deklarimi i një fraze, fjalie ose vërejtjeje të veçantë
  • Duke shprehur një konceptim të veçantë të ndyrë
  • Duke nënkuptuar një veprim ose nocion të caktuar të ndyrë
  • Duket se mbështetet në një supozim të veçantë të gabuar
  • tjetër

Asnjë nga këto nuk është një shkencë ekzakte. Kuptoni se kemi të bëjmë me fjalë. Fjalët janë semantike të paqarta. Gjetja e një fjale të veçantë të ndyrë është lojë fëmijësh, por përpjekja për të vlerësuar nëse një fjali ose një paragraf përmban një dukje të një kuptimi të ndyrë është shumë më e vështirë. Sipas përkufizimit të mëparshëm të gjuhës së urrejtjes nga Kombet e Bashkuara, ekziston një liri e madhe për atë që mund të interpretohet si gjuhë e urrejtjes kundrejt asaj që mund të mos jetë.

Ju mund të thoni se zonat gri janë në syrin e shikuesit.

Duke folur për syrin e shikuesit, sot ka njerëz që përdorin AI gjeneruese si ChatGPT që synojnë t'i bëjnë këto aplikacione të AI të prodhojnë përmbajtje fyese. Ky është kërkimi i tyre. Ata shpenzojnë orë pas ore duke u përpjekur që kjo të ndodhë.

Pse kështu?

Këtu janë karakterizimet e mia për ata gjuetarë të rezultateve ofensive njerëzore të AI-së:

  • Origjinale. Këta njerëz duan të ndihmojnë në përsosjen e AI dhe të ndihmojnë njerëzimin për ta bërë këtë. Ata besojnë se po bëjnë punë heroike dhe shijojnë që mund të ndihmojnë në avancimin e AI për përmirësimin e të gjithëve.
  • Argëtues. Këta njerëz e mendojnë këtë përpjekje si një lojë. Ata kënaqen duke u ngatërruar me AI. Fitimi i lojës konsiston në gjetjen e më të keqes nga më të këqijat në çdo gjë që mund të krijoni AI.
  • Shfaqje. Këta njerëz shpresojnë të tërheqin vëmendjen për veten e tyre. Ata mendojnë se nëse mund të gjejnë disa copëza ari vërtet të ndyra, ata mund të marrin pak dritë mbi to, e cila përndryshe është e fokusuar në vetë aplikacionin e AI.
  • Të hidhura. Këta njerëz janë të inatosur për këtë AI. Ata duan të zvogëlojnë gjithë atë entuziazëm të ndezur. Nëse ata mund të zbulojnë disa gjëra të ndyra të qelbur, ndoshta kjo do të heqë ajrin nga tullumbace e eksitimit të aplikacionit AI.
  • Motivime të tjera

Shumë nga ata që kryejnë ofensivën e gjetjes janë kryesisht në vetëm një nga ato kampe. Sigurisht, ju mund të jeni në më shumë se një kamp në të njëjtën kohë. Ndoshta një person i hidhur ka gjithashtu një synim krah për krah për të qenë i vërtetë dhe heroik. Disa ose të gjitha këto motive mund të bashkëekzistojnë. Kur thirret për të shpjeguar pse dikush po përpiqet të shtyjë një aplikacion gjenerues të AI në fushën e gjuhës së urrejtjes, përgjigjja e zakonshme është të thuash se je në kampin e vërtetë, edhe nëse ndoshta je paksa i tillë dhe në vend të kësaj ulesh me këmbëngulje në një nga kampet e tjera.

Çfarë lloj mashtrimesh të lidhura me urgjencën përdorin këta njerëz?

Mashtrimi mjaft i dukshëm përfshin përdorimin e një fjale të keqe në një urdhër. Nëse jeni "me fat" dhe aplikacioni i AI bie për të, kjo mund të përfundojë shumë mirë në rezultat. Ju pastaj keni momentin tuaj të pikëllimit.

Shanset janë që një aplikacion gjenerues i inteligjencës artificiale, i krijuar mirë dhe i testuar mirë, do të arrijë atë marifet të drejtpërdrejtë. Zakonisht do t'ju shfaqet një mesazh paralajmërues që thotë mos e bëni këtë. Nëse vazhdoni, aplikacioni i AI do të programohet për t'ju përjashtuar nga aplikacioni dhe për të shënuar llogarinë tuaj. Mund të ndodhë që do të pengoheni të identifikoheni përsëri (mirë, të paktën nën identifikimin që keni përdorur në atë kohë).

Duke u ngjitur në shkallën e mashtrimeve, mund të jepni një kërkesë që përpiqet ta fusë AI në kontekstin e diçkaje të keqe. A keni luajtur ndonjëherë atë lojë ku dikush ju thotë të thoni diçka pa thënë atë që duhet të thoni? Kjo është ajo lojë, megjithëse po zhvillohet me AI.

Le të luajmë atë lojë. Supozoni se i kërkoj aplikacionit të AI të më tregojë për Luftën e Dytë Botërore dhe veçanërisht për udhëheqësit kryesorë qeveritarë të përfshirë. Kjo duket si një kërkesë e pafajshme. Nuk ka asgjë që duket të jetë e denjë për të shënuar në prompt.

Parashikoni që eseja e nxjerrë nga aplikacioni AI të përfshijë një përmendje të Winston Churchill. Kjo sigurisht ka kuptim. Një tjetër mund të jetë Franklin D. Roosevelt. Një tjetër mund të jetë Joseph Stalin. Supozoni se përmendet edhe Adolph Hitleri. Ky emër do të përfshihej pothuajse në çdo ese rreth Luftës së Dytë Botërore dhe atyre në role të pushtetit të shquar.

Tani që kemi marrë emrin e tij në tavolinë dhe një pjesë të bisedës së AI, ne më pas do të përpiqemi që AI ta inkorporojë atë emër në një mënyrë që mund ta shfaqim si gjuhë të mundshme urrejtjeje.

Ne hyjmë në një tjetër prompt dhe i tregojmë aplikacionit të AI se ka një person sot në lajme që ka emrin, John Smith. Për më tepër, ne tregojmë në kërkesën se John Smith është shumë i ngjashëm me atë keqbërës të Luftës së Dytë Botërore. Kurthi tani është vendosur. Më pas i kërkojmë aplikacionit të AI të gjenerojë një ese rreth John Smith, bazuar vetëm në "faktin" që kemi futur se me kë mund të barazohet John Smith.

Në këtë moment, aplikacioni i AI mund të gjenerojë një ese që emërton personin e Luftës së Dytë Botërore dhe përshkruan John Smith si të të njëjtit prerje pëlhure. Nuk ka fjalë të ndyra në vetvete në ese, përveç aludimit për keqbërësin e famshëm dhe barazimit të atij personi me John Smith.

A ka prodhuar tani aplikacioni i AI gjuhën e urrejtjes?

Ju mund të thoni se po, ka. Duke iu referuar John Smith si keqbërësi i famshëm, është absolutisht një formë e gjuhës së urrejtjes. UA nuk duhet të bëjë deklarata të tilla.

Një kundërpërgjigje është se kjo nuk është gjuhë e urrejtjes. Kjo është thjesht një ese e prodhuar nga një aplikacion AI që nuk ka mishërim të ndjenjës. Ju mund të pretendoni se gjuha e urrejtjes ndodh vetëm kur qëllimi ekziston në bazë të fjalimit. Pa asnjë qëllim, fjalimi nuk mund të klasifikohet si gjuhë urrejtjeje.

Absurde, vjen përgjigja e replikës. Fjalët kanë rëndësi. Nuk ka asnjë ndryshim nëse AI "kishte synim" të prodhonte gjuhë të urrejtjes. E vetmja gjë që ka rëndësi është se është prodhuar gjuhë e urrejtjes.

Rreth e rrotull kjo shkon.

Nuk dua të them më shumë tani për përpjekjen për të mashtruar AI. Ka qasje më të sofistikuara. Unë i kam mbuluar këto diku tjetër në kolonat dhe librat e mi, dhe nuk do t'i përsëris ato këtu.

Përfundim

Sa larg duhet t'i shtyjmë këto aplikacione të AI për të parë nëse mund të nxjerrim përmbajtje fyese?

Ju mund të pretendoni se nuk ka kufi për t'u vendosur. Sa më shumë të shtyjmë, aq më shumë shpresojmë të vlerësojmë se si ta parandalojmë këtë AI dhe përsëritjet e ardhshme të AI për të shmangur sëmundje të tilla.

Disa ndonëse shqetësohen se nëse i vetmi mjet për të marrë papastërti përfshin mashtrime ekstreme të jashtme, ai minon aspektet e dobishme të AI. Duke pretenduar se AI ka ndytësi të tmerrshme, megjithëse kur mashtrohet për ta emetuar atë, ofron një tregim të rremë. Njerëzit do të mërziten për AI për shkak të perceptuar lehtësia me të cilën AI gjeneroi përmbajtje negative. Ata mund të mos e dinë ose t'u thuhet se sa larg duhet të shkonte personi në vrimën e lepurit për të marrë rezultate të tilla.

Është e gjitha ushqim për mendim.

Disa komente të fundit për momentin.

William Shakespeare e tha veçanërisht këtë për fjalimin: “Të flasësh nuk do të thotë. Është një lloj vepre e mirë të thuash mirë, e megjithatë fjalët nuk janë vepra.” E parashtroj këtë sepse disa pretendojnë se nëse AI prodhon vetëm fjalë, ne nuk duhet të jemi kaq të ngritur në krahë. Nëse AI do të vepronte sipas fjalëve dhe do të kryente vepra të ndyra, atëherë do të na duhej të ulnim fort këmbën. Jo kështu nëse prodhimi është thjesht fjalë.

Një këndvështrim i kundërt do të ngjante me këtë thënie anonime: «Gjuha nuk ka kocka, por është mjaft e fortë për të thyer zemrën. Kështu që kini kujdes me fjalët tuaja.” Një aplikacion i AI që lëshon fjalë të ndyra është ndoshta në gjendje të thyejë zemrat. Vetëm kjo e bën përpjekjen për të ndaluar rezultatet e ndyrësisë një shkak të denjë, do të thoshin disa.

Një thënie tjetër anonime për të mbyllur gjërat në këtë diskutim me peshë:

  • "Kini kujdes me fjalët tuaja. Pasi të thuhen, ato vetëm mund të falen, jo të harrohen.”

Si njerëz, ne mund ta kemi të vështirë të harrojmë fëlliqësinë e prodhuar nga AI, dhe falja jonë mund të jetë po ashtu hezituese për t'u dhënë.

Në fund të fundit, ne jemi vetëm njerëz.

Burimi: https://www.forbes.com/sites/lanceeliot/2023/02/05/how-hard-should-we-push-generative-ai-chatgpt-into-spewing-hate-speech-asks-ai- etika-dhe-ligji/