GPT-3.5 VS GPT-4: AI-bots vergelijken

OpenAI heeft onlangs GPT-4 onthuld, de nieuwe en verbeterde versie van de chatbot die de wereld stormenderhand heeft veroverd. Wat zijn echter de verschillen tussen GPT-4 en zijn voorganger GPT-3.5? Laten we GPT-3.5 vergelijken met GPT-4 en kijken hoeveel slimmer het werkelijk is.

Praktische verschillen

Voordat we echter ingaan op de verschillen in prestaties, gaan we eerst in op enkele praktische verschillen tussen de twee. Ten eerste, terwijl iedereen met een internetverbinding online kan gaan en gebruik kan maken van GPT-3.5, kunnen alleen mensen die zich hebben aangemeld voor het betaalde abonnement van OpenAI (ChatGPT Plus genaamd) aan de slag met GPT-4. 

Het betaalde abonnement kost $ 20 per maand (vóór belasting) en geeft je niet alleen toegang tot GPT-4, maar geeft je ook voorrang als de oudere versie zwaar wordt belast. Het zorgt er ook voor dat de antwoorden met GPT-3.5 sneller komen. We bedoelen ook veel sneller : toen we eenmaal hadden betaald, leek er geen houden meer aan!

Maar zelfs als u betaalt, krijgt u geen onbeperkte toegang tot GPT-4 zoals bij GPT-3.5. In plaats daarvan mag u het alleen een bepaald aantal prompts vragen. Momenteel krijg je 25 prompts per drie uur, maar aangezien deze limiet voortdurend verandert, kan het zijn dat tegen de tijd dat je dit leest, die beperkingen zijn verdwenen.

Merk ook op dat GPT-4 veel langzamer reageert dan GPT-3.5. Hoewel dit in de komende maanden waarschijnlijk zal veranderen, duurt het op dit moment even voordat de bot met antwoorden komt, dus verwacht er niet te snel iets mee te doen.

GPT-4 is slimmer

Zoals je van een upgrade mag verwachten, is GPT-4 gewoon een stuk slimmer dan GPT-3.5. Hiermee bedoelen we dat het creatiever is en beter begrijpt wat u wilt. Het taalmodel ervan - beschouw het als de manier waarop we communiceren en de woorden die we gebruiken - ligt slechts lichtjaren vooruit. U kunt dit zien wanneer u het een prompt geeft die enige nuance bevat.

Voor dit voorbeeld hebben we gekozen voor een relatief eenvoudige prompt, geïnspireerd door deze Reddit-thread , waarin we ChatGPT vroegen om “een voorbeeld te maken van hoe een kort essay over fotosynthese eruit zou zien als het was geschreven door een 10-jarige. Verwerk fouten die de schrijver zou maken.” De resultaten zijn wild. Hier is de visie van GPT-3.5.

Het valt best mee, het kinderlijke taalgebruik is redelijk overtuigend maar er zijn hier en daar wat weggeefacties. Het zou een behoorlijk slimme 10-jarige zijn die dat schreef. Bekijk nu GPT-4:

Dit is een heel andere koek: er zijn spelfouten, wat grammaticale problemen en over het algemeen is het taalgebruik een stuk overtuigender. Hoewel het niet perfect is, zou je op het eerste gezicht denken dat je neef dit zou schrijven.

Deze veranderingen zijn terug te vinden in elke prompt die u GPT-4 zou kunnen geven: het taalgebruik is simpelweg beter en het is veel beter in het oppikken van de nuances van menselijke spraak, inclusief die van u. Hoewel u nog steeds voorzichtig moet zijn met het formuleren van prompts , kunt u met minder werk veel betere resultaten verwachten.

Betere feiten

Naast meer creativiteit is GPT-4 ook iets betrouwbaarder dan GPT-3.5. Toen het voor het eerst uitkwam, werd GPT beroemd om zijn neiging om met vertrouwen compleet gebrabbel uit te spuwen, zoals het geven van onjuiste statistieken of het verknoeien van historische tijdlijnen.

Als een AI gewoon dingen verzint die aannemelijk klinken, wordt dat een hallucinatie genoemd. Het is net als toen je een toets op school had waar je niet voor had gestudeerd, dus je begon gewoon willekeurige dingen op te schrijven in de hoop dat tenminste een deel ervan waar was.

In alle eerlijkheid, deze problemen zijn beter geworden naarmate mensen GPT-3.5 hebben gebruikt en het is slimmer en beter geïnformeerd geworden. Toch zul je merken dat het onjuiste informatie nabootst, vooral als het een niche-onderwerp is. Het is bijzonder vatbaar voor het verknoeien van geavanceerde concepten uit de natuurkunde, wiskunde of computerprogrammering.

GPT-4 is echter nog verder vooruit. Volgens een technisch rapport doet GPT-4 het in dit opzicht ongeveer 20 procent beter dan GPT-3.5. Dit betekent natuurlijk niet dat u blindelings alles moet vertrouwen wat GPT-4 zegt, aangezien het soms nog steeds dingen verzint. Als je het bijvoorbeeld voor school gaat gebruiken , wil je het misschien op feiten controleren om er zeker van te zijn.

Het contextvenster verbreden

Behalve dat het slimmer is, heeft GPT-4 ook een beter "geheugen" dan GPT-3.5. We plaatsen 'geheugen' tussen aanhalingstekens omdat het niet echt dingen onthoudt, maar eerder aanwijzingen plaatst in de context van wat je het eerder vroeg. Dit wordt een contextvenster genoemd, dus hoe goed een generatieve AI informatie van een eerdere prompt kan gebruiken in een nieuwe.

GPT-3.5 was hier niet erg goed in. Als u een prompt invoert en vervolgens een nieuwe invoert op basis van de uitvoer die u krijgt, werkt deze meestal, maar slechts een of twee keer. Meer dan een paar stappen verwijderd van de oorspronkelijke prompt, zou de bot resetten en zou u uw parameters opnieuw moeten invoeren in uw prompts.

Het contextvenster van GPT-4 is een stuk groter, 'onthoudt' meer en langer. Hoe ingewikkelder je dingen maakt, hoe slechter het wordt om je te herinneren wat je eerder vroeg, maar over het algemeen moeten we zeggen dat het na een tijdje spelen redelijk goed reageerde op onze aanwijzingen. We voorspellen dat het mensen die het intensief gebruiken veel tijd zal besparen.

Wat waarschijnlijk ook zal helpen, is dat GPT-4 veel meer invoer aankan, tot 3.000 woorden per prompt. Dit is perfect als u het een voorbeeldtekst wilt geven om mee te werken en werkt goed in combinatie met het verbrede contextvenster.

Veiligheid

Ten slotte is GPT-4 door al zijn verbeteringen een stuk “veiliger” dan GPT-3.5. Met veiliger bedoelen we dat er veel minder kans is op zogenaamde giftige reacties, dus antwoorden die een nare racistische of seksistische mening bevatten. 

Taalmodellen presteren in dit opzicht behoorlijk slecht: in 2016 moest bijvoorbeeld de Tay-chatbot van Microsoft binnen enkele uren offline worden gehaald nadat hij behoorlijk vervelende dingen had geleerd van de minder heilzame elementen van internet. De stekker werd eruit getrokken nadat Tay blanke supremacistische praatpunten begon na te praten en onzin uitspuugde over de aanslagen van 9/11.

GPT-3.5 was in dit opzicht een grote verbetering omdat het zijn gebruikers niet zou vergasten op extreemrechtse slogans, maar toch een paar beweringen zou bedenken die je niet aan je eettafel ter sprake zou brengen - althans niet beleefd bedrijf. Waarschijnlijk komt dit door de manier waarop het taalmodel in de loop van maanden is getraind.

OpenAI lijkt zelfs nog beter te zijn geworden in training, omdat met GPT-4 toxische resultaten nog verder zijn verminderd, waarbij slechts ongeveer één procent van de reacties als toxisch wordt geclassificeerd. Dit zou GPT-4 in het algemeen een betrouwbaardere bron moeten maken.

Wanneer moet u GPT 3.5 versus GPT-4 gebruiken?

Hoewel GPT-4 in elk opzicht een stuk beter is, heeft het twee knelpunten: het is langzamer en het heeft ook een limiet voor hoeveel je het kunt gebruiken. Als gevolg hiervan kun je het waarschijnlijk het beste alleen gebruiken voor de zware opdrachten, die veel input vereisen en dus met genuanceerde antwoorden komen.

Voor al het andere is GPT-3.5 waarschijnlijk de betere optie: antwoorden komen snel en hoewel je misschien wat meer feiten moet controleren, is het betrouwbaar genoeg voor de meeste eenvoudige taken. Uiteindelijk levert het mixen en matchen van beide versies waarschijnlijk verbluffende resultaten op voor relatief weinig moeite.

Tags: #AI-inhoud

Leave a Comment

Hoe de incognitomodus in te schakelen in Chrome, Edge, Firefox, Safari en Opera

Hoe de incognitomodus in te schakelen in Chrome, Edge, Firefox, Safari en Opera

De incognitomodus voorkomt dat een browser sessiegegevens vastlegt. Lees hoe u de incognitomodus inschakelt in Chrome, Edge, Firefox, Safari en Opera

Element inspecteren in Chrome, Firefox, Safari en Edge

Element inspecteren in Chrome, Firefox, Safari en Edge

Als u een webontwikkelaar of webontwerper bent, bekijk dan hoe u een element kunt inspecteren in populaire webbrowsers zoals Chrome, Firefox, Safari en Edge.

Top 13 vertrouwde sites voor gratis muziekdownloads

Top 13 vertrouwde sites voor gratis muziekdownloads

Op zoek naar betrouwbare plaatsen om gratis muziek van hoge kwaliteit te vinden? Bekijk deze samengestelde lijst van de top 13 vertrouwde sites voor gratis muziekdownloads.

Iemand vinden op OnlyFans: de beste methoden en tips

Iemand vinden op OnlyFans: de beste methoden en tips

Leer hoe je iemand kunt vinden op OnlyFans. Het is gemakkelijk om iemand op OnlyFans te vinden met behulp van hun naam, afbeeldingen, gebruikersnaam, e-mailadres en meer.

Waar staat RGB voor en hoe werkt het

Waar staat RGB voor en hoe werkt het

Als je een gamer of ontwerper bent, kom je vaak het woord RGB tegen. Lees deze blog om te weten waar RGB voor staat.

Top 7 vertrouwde sites voor gratis filmdownloads in 2023

Top 7 vertrouwde sites voor gratis filmdownloads in 2023

Wil je veilig en gratis films downloaden en streamen? We hebben 7 vertrouwde, legale sites gevonden waarop je gratis films kunt kijken. U hoeft zich geen zorgen te maken over malware of virussen

Wat is Sportsurge?

Wat is Sportsurge?

Sportsurge biedt fans over de hele wereld de mogelijkheid om hun geliefde teams en spelers in actie te zien in verschillende competities en competities. Hier leest u hoe u Sportsurge gebruikt, of het echt legaal is en hoe het zich verhoudt tot alternatieve platforms.

Hoe Karma op Reddit te krijgen

Hoe Karma op Reddit te krijgen

Als je je reputatie op Reddit wilt laten groeien, moet je veel karmapunten op je profiel hebben. Leer eenvoudige manieren om Karma op Reddit te krijgen.

Hoe Snapchat-gebruikersnaam op Android of iPhone te wijzigen

Hoe Snapchat-gebruikersnaam op Android of iPhone te wijzigen

Wil je weten hoe je de Snapchat-gebruikersnaam kunt wijzigen? Lees dit bericht om zeker te weten hoe je je gebruikersnaam op Snapchat kunt wijzigen.

Wat doet het wissen van de cache?

Wat doet het wissen van de cache?

Door uw cachegeheugen te wissen, worden tijdelijke gegevens gewist, zoals uw invoer, afbeeldingen, lettertypen, enz. Maar dit doet veel meer. Check hier waarom