ChatGPT V4 trece pe bară, SAT și poate identifica exploatările în contractele ETH

GPT-4, cea mai recentă versiune a chatbot-ului de inteligență artificială (AI), ChatGPT, poate trece testele de liceu și examenele de la facultatea de drept, cu scoruri în percentila 90 și are noi capacități de procesare care nu erau posibile cu versiunea anterioară.

Cifrele din scorurile testelor GPT-4 au fost împărtășite pe 14 martie de către creatorul său, OpenAI, dezvăluind că poate converti, de asemenea, intrările de imagini, audio și video în text, pe lângă gestionarea „instrucțiilor mult mai nuanțate” mai creativ și mai fiabil.

„Succesează un examen simulat de bară cu un scor în jurul primilor 10% dintre cei care iau test”, a adăugat OpenAI. „În contrast, scorul GPT-3.5 a fost în jurul valorii de 10% de jos.”

Cifrele arată că GPT-4 a obținut un scor de 163 în percentila 88 la examenul LSAT - studenții de la facultate trebuie să treacă în Statele Unite pentru a fi admiși la facultatea de drept.

*Rezultatele examenelor GPT-4 și GPT-3.5 la o serie de examene recente din SUA. Sursă:* *OpenAI*

Scorul GPT4 l-ar pune într-o poziție bună pentru a fi admis într-o școală de drept din top 20 și este cu doar câteva note mai puțin de scorurile raportate necesare pentru acceptarea în școli prestigioase precum Harvard, Stanford, Princeton sau Yale.

Versiunea anterioară a ChatGPT a obținut doar 149 la LSAT, plasându-l în 40%.

GPT-4 a obținut, de asemenea, nota de 298 din 400 la Examenul Baroului Uniform – un test întreprins de studenți recent absolvenți la drept, care le permite să profeseze ca avocat în orice jurisdicție din SUA.

*Scorurile UBE trebuiau să fie admise pentru a practica avocatura în fiecare jurisdicție din SUA. Sursă:* *Conferința Națională a Examinatorilor Baroului*

Vechea versiune a ChatGPT a avut probleme în acest test, terminând în ultimii 10% cu un scor de 213 din 400.

În ceea ce privește examenele SAT de citire și scriere bazate pe dovezi și examenele SAT de matematică susținute de elevii de liceu din SUA pentru a-și măsura gradul de pregătire pentru facultate, GPT-4 a obținut un scor în percentilele 93 și, respectiv, 89.

GPT-4 a excelat și în științele „hard”, afișând scoruri percentile cu mult peste medie în AP Biologie (85-100%), Chimie (71-88%) și Fizică 2 (66-84%).

*Rezultatele examenelor GPT-4 și GPT-3.5 la o serie de examene recente din SUA.* *Sursa: OpenAI.*

Cu toate acestea, scorul său AP Calculus a fost destul de mediu, clasându-se între percentilele 43r și 59.

Un alt domeniu în care GPT-4 a lipsit a fost cel al examenelor de literatură engleză, postând scoruri în percentilele 8-44 la două teste separate.

OpenAI a spus că GPT-4 și GPT-3.5 au susținut aceste teste de la examenele de practică 2022-2023 și că „nicio pregătire specifică” nu a fost luată de instrumentele de procesare a limbii:

„Nu am făcut nicio pregătire specifică pentru aceste examene. O minoritate dintre problemele de la examene au fost văzute de model în timpul antrenamentului, dar credem că rezultatele sunt reprezentative.”

Rezultatele au provocat teamă și în comunitatea Twitter.

Related: Cum va afecta ChatGPT spațiul Web3? Industria răspunde

Nick Almond, fondatorul FactoryDAO a spus cei 14,300 de urmăritori ai săi pe Twitter pe 14 martie că GPT4 va „sperii oamenii” și va „colapsa” sistemul global de educație.

Teoria evaluării a fost o mare parte din viața mea timp de câțiva ani. Am bătut cu mulți ani în urmă despre această zi. Păream literalmente ca manivelul rezident la acea vreme.
Dar... într-adevăr asta înseamnă că orice altceva în afară de evaluarea supravegheată s-a terminat din acest punct încolo.
— drnick ️² (@DrNickA) Martie 14, 2023

Fostul director Coinbase, Conor Grogan, a declarat că a inserat un contract inteligent Ethereum live în GPT-4 și a subliniat instantaneu mai multe „vulnerabilitati de securitate” și a subliniat cum poate fi exploatat codul:

Am transferat un contract live Ethereum în GPT-4.
Într-o clipă, a evidențiat o serie de vulnerabilități de securitate și a subliniat zonele de suprafață în care contractul ar putea fi exploatat. Apoi a verificat un mod specific în care puteam exploata contractul pic.twitter.com/its5puakUW
— Conor (@jconorgrogan) Martie 14, 2023

Auditurile anterioare ale contractelor inteligente pe ChatGPT au constatat că prima sa versiune a fost, de asemenea, capabilă să detecteze erorile de cod într-o măsură rezonabilă.

Rowan Cheung, fondatorul buletinului informativ AI „The Rundown” a distribuit un videoclip cu GPT transcriind un site web fals desenat manual pe o bucată de hârtie în cod.

Tocmai am văzut GPT-4 transformând o schiță desenată manual într-un site web funcțional.
Este o nebunie. pic.twitter.com/P5nSjrk7Wn
— Rowan Cheung (@rowancheung) Martie 14, 2023