OpenAI a dezvăluit recent GPT-4, versiunea nouă și îmbunătățită a chatbot-ului care a luat lumea cu asalt. Care sunt diferențele dintre GPT-4 și predecesorul său GPT-3.5, totuși? Să comparăm GPT-3.5 cu GPT-4 și să aruncăm o privire la cât de mult mai inteligent este cu adevărat.
Diferențele practice
Înainte de a ajunge la diferențele de performanță, totuși, să trecem mai întâi peste câteva diferențe practice dintre cele două. În primul rând, în timp ce oricine are o conexiune la internet poate intra online și poate folosi GPT-3.5, numai persoanele care au optat pentru planul plătit al OpenAI (numit ChatGPT Plus) pot să se încurce cu GPT-4.
Planul plătit este de 20 USD pe lună (înainte de taxe) și nu numai că vă oferă acces la GPT-4, ci vă oferă și prioritate dacă versiunea mai veche se confruntă cu o sarcină mare. De asemenea, face ca răspunsurile cu GPT-3.5 să vină mai repede. Ne referim și la mult mai repede: odată ce am plătit, părea că nu se poate opri!
Cu toate acestea, chiar dacă plătiți, nu aveți acces nelimitat la GPT-4, așa cum faceți cu GPT-3.5. În schimb, puteți să îi cereți doar un anumit număr de solicitări. În prezent, primiți 25 de solicitări la trei ore, dar deoarece această limită se schimbă constant, s-ar putea ca până când citiți aceste restricții să dispară.
De asemenea, rețineți că GPT-4 răspunde mult mai lent decât GPT-3.5. Deși probabil că acest lucru se va schimba în lunile următoare, în acest moment bot-ului îi ia ceva timp pentru a găsi răspunsuri, așa că nu vă așteptați să faceți ceva prea repede cu el.
GPT-4 este mai inteligent
După cum v-ați aștepta de la o actualizare, GPT-4 este pur și simplu mult mai inteligent decât GPT-3.5. Prin aceasta ne referim la faptul că este mai creativ și mai bun în a înțelege ceea ce vrei. Modelul său de limbaj – regândește-l ca felul în care comunicăm și cuvintele pe care le folosim – este cu doar ani lumină înainte. Puteți vedea acest lucru atunci când îi furnizați un prompt care are unele nuanțe.
Pentru acest exemplu, ne-am hotărât asupra unui prompt relativ simplu, inspirat de acest thread Reddit , prin care i-am cerut lui ChatGPT să „creeze un exemplu despre cum ar arăta un scurt eseu despre fotosinteză dacă ar fi scris de un copil de 10 ani. Includeți greșelile pe care le-ar face scriitorul.” Rezultatele sunt sălbatice. Iată părerea lui GPT-3.5.
Nu e prea rău, folosirea infantilă a limbajului este destul de convingătoare, dar există câteva cadouri ici și colo. Ar fi un copil destul de inteligent de 10 ani care a scris asta. Acum verificați GPT-4:
Acesta este un ibric cu totul diferit: există greșeli de ortografie, unele probleme de gramatică și, în general, utilizarea limbajului este mult mai convingătoare. Deși nu este perfect, la prima vedere ai crede că nepotul tău ar scrie asta.
Aceste modificări se reflectă în fiecare solicitare pe care ați putea să-i dați GPT-4: utilizarea sa a limbajului este pur și simplu mai bună și este mult mai bună pentru a capta nuanțele vorbirii umane, inclusiv ale dvs. Deși trebuie să fiți atenți la modul în care formulați solicitările , vă puteți aștepta la rezultate mult mai bune cu mai puțină muncă.
Fapte mai bune
Alături de mai multă creativitate, GPT-4 este, de asemenea, puțin mai de încredere decât GPT-3.5. Când a apărut pentru prima dată, GPT a devenit faimos pentru tendința sa de a scoate încrezători complete, cum ar fi oferirea de statistici incorecte sau încurcarea cronologiei istorice.
Când o IA pur și simplu inventează lucruri care sună plauzibile, se numește halucinație. Este ca atunci când ai avut un test la școală pentru care nu ai studiat, așa că ai început să scrii lucruri aleatorii, în speranța că măcar o parte din ele sunt adevărate.
În mod corect, aceste probleme au devenit mai bune pe măsură ce oamenii au folosit GPT-3.5 și a devenit mai inteligent și mai informat. Cu toate acestea, veți descoperi că papagalii informații incorecte, mai ales dacă este un subiect de nișă. Este deosebit de predispusă să încurce concepte avansate din fizică, matematică sau programare pe computer.
GPT-4, totuși, este și mai înainte. Potrivit unui raport tehnic , GPT-4 face cu aproximativ 20% mai bine decât GPT-3.5 în acest sens. Desigur, asta nu înseamnă că ar trebui să ai încredere orbește în tot ceea ce spune GPT-4, deoarece uneori tot va inventa lucrurile. Dacă îl veți folosi pentru școală , să zicem, poate doriți să-l verificați pentru a vă asigura.
Lărgirea ferestrei de context
Pe lângă faptul că este mai inteligent, GPT-4 are și o „memorie” mai bună decât are GPT-3.5. Am pus „memorie” între ghilimele pentru că nu își amintește cu adevărat lucrurile, ci mai degrabă pune solicitări în contextul a ceea ce ați întrebat-o înainte. Aceasta se numește o fereastră de context, deci cât de bine poate un AI generativ să folosească informațiile dintr-un prompt anterior într-unul nou.
GPT-3.5 nu a fost foarte bun la asta. Dacă ați introdus un prompt și apoi ați introdus unul nou pe baza rezultatului pe care l-ați primit, de obicei, ar funcționa, dar numai o dată sau de două ori. La mai mult de câțiva pași de la promptul inițial, botul s-ar reseta și va trebui să vă introduceți din nou parametrii în solicitări.
Fereastra de context a GPT-4 este mult mai mare, „amintindu-se” mai mult și pentru mai mult timp. Cu cât faci lucrurile mai complicate, cu atât devine mai rău să-ți amintești ceea ce ai întrebat înainte, dar în general, după ce ne-am jucat puțin, trebuie să spunem că a răspuns destul de bine la solicitările noastre. Previzăm că va economisi mult timp pe cei care îl folosesc intens.
Ceea ce va ajuta probabil, de asemenea, este că GPT-4 poate gestiona mult mai multe intrări, până la 3.000 de cuvinte per prompt. Acest lucru este perfect dacă doriți să îi furnizați un exemplu de text cu care să lucrați și funcționează bine împreună cu fereastra de context extinsă.
Siguranță
În cele din urmă, din cauza tuturor îmbunătățirilor sale, GPT-4 este mult mai „sigur” decât GPT-3.5. Prin mai sigur înțelegem că există mult mai puține șanse de a obține așa-zise răspunsuri toxice, deci răspunsuri care implică păreri rasiste sau sexiste.
Modelele lingvistice au o performanță destul de slabă în acest sens: în 2016, de exemplu, chatbot-ul Tay de la Microsoft a trebuit să fie scos offline în doar câteva ore după ce a fost învățat niște lucruri destul de urâte de elementele mai puțin salubre ale internetului. S-a scos ștecherul după ce Tay a început să spună papagalile despre supremația albă și să scoată prostii despre atacurile din 11 septembrie.
GPT-3.5 a reprezentat o îmbunătățire majoră în această privință, deoarece nu și-a răsfățat utilizatorii cu sloganuri de extremă dreaptă, dar va veni cu câteva afirmații pe care nu le-ați aduce la masă la cină - cel puțin nu în mod politicos companie. Probabil că acest lucru se datorează modului în care modelul lingvistic a fost antrenat de-a lungul lunilor.
Se pare că OpenAI a devenit și mai bun la antrenament, deoarece cu GPT-4 rezultatele toxice au fost reduse și mai mult, doar aproximativ un procent din răspunsuri fiind clasificate ca toxice. Acest lucru ar trebui să facă din GPT-4 o resursă mai de încredere în general.
Când ar trebui să utilizați GPT 3.5 vs GPT-4?
În timp ce GPT-4 este mult mai bun din toate punctele de vedere, vine cu două gâturi de sticlă: este mai lent și are, de asemenea, o limită pentru cât de mult îl poți folosi. Ca rezultat, probabil că este cel mai bine să-l folosești doar pentru solicitările grele, cele care necesită multă intervenție și, astfel, vin cu răspunsuri nuanțate.
Pentru orice altceva, GPT-3.5 este probabil cea mai bună opțiune: răspunsurile vin rapide și, deși poate fi necesar să verificați puțin mai mult, este suficient de fiabil pentru majoritatea sarcinilor simple. În cele din urmă, amestecarea și potrivirea ambelor versiuni vă va aduce probabil rezultate uimitoare pentru un efort relativ mic.