ChatGPT V4 kalon shiritin, SAT dhe mund të identifikojë shfrytëzimet në kontratat ETH

GPT-4, versioni më i fundit i chatbot-it të inteligjencës artificiale (AI), ChatGPT, mund të kalojë testet e shkollës së mesme dhe provimet e shkollës juridike me pikë të renditura në përqindjen e 90-të dhe ka aftësi të reja përpunimi që nuk ishin të mundshme me versionin e mëparshëm.

Shifrat nga rezultatet e testit të GPT-4 u ndanë më 14 mars nga krijuesi i tij OpenAI, duke zbuluar se ai gjithashtu mund të konvertojë hyrjet e imazhit, audio dhe video në tekst, përveç trajtimit të "udhëzimeve shumë më të nuancuara" në mënyrë më kreative dhe të besueshme.

"Ai kalon një provim të simuluar të jurisprudencës me një rezultat rreth 10% më të mirë të testuesve," shtoi OpenAI. "Në të kundërt, rezultati i GPT-3.5 ishte rreth 10% e fundit."

Shifrat tregojnë se GPT-4 arriti një rezultat prej 163 në përqindjen e 88-të në provimin LSAT - studentët e kolegjit testues duhet të kalojnë në Shtetet e Bashkuara për t'u pranuar në shkollën juridike.

*Rezultatet e provimit të GPT-4 dhe GPT-3.5 në një sërë provimesh të fundit në SHBA. Burimi:* *OpenAI*

Rezultati i GPT4 do ta vendoste atë në një pozicion të mirë për t'u pranuar në një shkollë juridike 20 më të mirë dhe është vetëm disa pikë më pak nga rezultatet e raportuara të nevojshme për pranim në shkollat prestigjioze si Harvard, Stanford, Princeton ose Yale.

Versioni i mëparshëm i ChatGPT shënoi vetëm 149 në LSAT duke e vendosur atë në 40% të fundit.

GPT-4 gjithashtu shënoi 298 nga 400 në Provimin Uniform të Jurisprudencës - një test i ndërmarrë nga studentë të drejtësisë të sapodiplomuar që i lejon ata të ushtrojnë profesionin e avokatit në çdo juridiksion të SHBA.

*Rezultatet e UBE-së duhej të pranoheshin për të praktikuar ligjin në çdo juridiksion të SHBA. Burimi:* *Konferenca Kombëtare e Ekzaminuesve të Jurisprudencës*

Versioni i vjetër i ChatGPT pati vështirësi në këtë test, duke përfunduar në 10% të fundit me një rezultat 213 nga 400.

Sa i përket provimeve SAT Reading & Writing bazuar në dëshmi dhe SAT Math të marra nga nxënësit e shkollave të mesme të SHBA për të matur gatishmërinë e tyre në kolegj, GPT-4 shënoi në përqindjen e 93-të dhe 89-të respektivisht.

GPT-4 shkëlqeu edhe në shkencat "të vështira", duke postuar rezultate shumë mbi mesataren e përqindjes në AP Biologji (85-100%), Kimi (71-88%) dhe Fizikë 2 (66-84%).

Sidoqoftë, rezultati i tij në AP Calculus ishte mjaft mesatar, duke u renditur në përqindjen 43r deri në 59-të.

Një fushë tjetër ku mungonte GPT-4 ishte provimet e Letërsisë Angleze, duke postuar pikë në përqindjen e 8-të deri në 44-të në dy teste të veçanta.

OpenAI tha se GPT-4 dhe GPT-3.5 i morën këto teste nga provimet praktike 2022-2023 dhe se "asnjë trajnim specifik" nuk u mor nga mjetet e përpunimit të gjuhës:

“Nuk kemi bërë asnjë trajnim specifik për këto provime. Një pakicë e problemeve në provime janë parë nga modelja gjatë trajnimit, por ne besojmë se rezultatet janë përfaqësuese.”

Rezultatet shkaktuan frikë edhe në komunitetin Twitter.

Related: Si do të ndikojë ChatGPT në hapësirën Web3? Përgjigjet e industrisë

Nick Almond, themeluesi i FactoryDAO tha 14,300 ndjekësit e tij në Twitter më 14 mars se GPT4 do t'i "trembë njerëzit" dhe do të "kolapsojë" sistemin arsimor global.

Teoria e vlerësimit ishte një pjesë e madhe e jetës sime për disa vite. Unë isha i zhurmshëm për këtë ditë që po vinte shumë vite më parë. Unë fjalë për fjalë dukej si maniak banor në atë kohë.
Por… në të vërtetë kjo do të thotë se çdo gjë përveç vlerësimit të kujdesshëm ka përfunduar që nga ky moment.
— drnick ️² (@DrNickA) March 14, 2023

Ish-drejtori i Coinbase, Conor Grogan, tha se ai futi një kontratë inteligjente të drejtpërdrejtë Ethereum në GPT-4 dhe menjëherë vuri në dukje disa "dobësi sigurie" dhe përshkroi se si mund të shfrytëzohet kodi:

Kam hedhur një kontratë të drejtpërdrejtë Ethereum në GPT-4.
Në një çast, ai theksoi një sërë dobësish të sigurisë dhe vuri në dukje sipërfaqet ku mund të shfrytëzohej kontrata. Më pas verifikoi një mënyrë specifike se si mund ta shfrytëzoja kontratën pic.twitter.com/its5puakUW
— Conor (@jconorgrogan) March 14, 2023

Auditimet e mëparshme të kontratave inteligjente në ChatGPT zbuluan se versioni i tij i parë ishte gjithashtu i aftë të zbulonte gabimet e kodit në një shkallë të arsyeshme gjithashtu.

Rowan Cheung, themeluesi i buletinit të AI "The Rundown" ndau një video të GPT duke transkriptuar një faqe interneti të rreme të vizatuar me dorë në një copë letër në kod.

Sapo pashë GPT-4 të kthente një skicë të vizatuar me dorë në një faqe interneti funksionale.
Kjo është e çmendur. pic.twitter.com/P5nSjrk7Wn
— Rowan Cheung (@rowancheung) March 14, 2023