Medzi starším modelom GPT-3.5 a lesklým novým modelom GPT-4 je niekoľko kľúčových rozdielov.
Po všetkých špekuláciách a tvrdeniach týkajúcich sa schopností GPT-4 bola 14. marca 2023 spustená dlho očakávaná štvrtá iterácia rodiny jazykových modelov GPT.
GPT-4 neprišiel s niektorými toľko propagovanými funkciami, o ktorých sa hovorilo, že má. Najnovší model však výrazne vylepšuje GPT-3.5 a jeho predchodcov. Ako sa však GPT-4 líši od GPT-3.5? Prevedieme vás niekoľkými kľúčovými rozdielmi medzi GPT-4 a GPT-3.5.
1. GPT-4 vs. GPT-3.5: Kreativita
Jednou z najvýraznejších výhod modelu GPT-4 oproti GPT-3.5 je jeho schopnosť poskytovať kreatívnejšie odpovede na výzvy. Nechápte ma zle; GPT-3.5 je veľmi kreatívny. Existuje dlhý zoznam kreatívne veci, ktoré môžete robiť s ChatGPT, ktorý používa model. Tvorivosťou však už prekonáva mnohé veľké jazykové modely.
GPT-4 však posúva latku ešte ďalej. Hoci kreatívna výhoda GPT-4 nemusí byť zrejmá pri riešení základných problémov, rozdiel v kreativita medzi oboma modelmi sa prejaví, keď sa úloha stáva ťažšou a vyžaduje vyššiu úroveň tvorivosť.
Ak napríklad požiadate oba modely, aby dokončili kreatívnu úlohu, ako je napísanie básne s použitím angličtiny aj francúzštiny na každom riadku básne, ChatGPT poháňaný najnovším modelom GPT-4 prinesie lepšie výsledky. Zatiaľ čo odpoveď GPT-4 by používala oba jazyky na každom riadku, GPT-3.5 by namiesto toho striedala obidva jazyky, pričom každý riadok používa jeden jazyk a ďalší používa druhý.
2. GPT-4 vs. GPT-3.5: Obrazové alebo vizuálne vstupy
Zatiaľ čo GPT-3.5 môže akceptovať iba textové výzvy, GPT-4 je multimodálny a môže akceptovať textové aj vizuálne vstupy. Aby bolo jasné, keď hovoríme o vizuálnych vstupoch, obrázok nemusí byť obrazom napísanej výzvy – môže to byť obraz čohokoľvek. Takže od obrázka ručne písaného matematického problému až po memy Reddit, GPT-4 dokáže pochopiť a opísať takmer akýkoľvek obrázok.
Na rozdiel od GPT-3 je GPT-4 jazykový aj vizuálny model.
Počas živého vysielania oznámenia GPT-4 inžinier OpenAI nakŕmil model snímkou obrazovky servera Discord. GPT-4 mohol opísať každý detail na ňom, vrátane mien používateľov online v tom čase. Modelka dostala aj obrázok ručne nakreslenej makety vtipnej webovej stránky s pokynmi premeňte ho na webovú stránku a prekvapivo GPT-4 poskytol funkčný kód pre webovú stránku, ktorá sa zhodovala s obrázok.
3. GPT-4 vs. GPT-3.5: Bezpečnejšie reakcie
Hoci GPT-4 nie je dokonalý, opatrenia, ktoré prijíma na zaistenie bezpečnejších reakcií, sú vítanou inováciou oproti modelu GPT-3.5. S GPT-3.5 OpenAI zaujal prístup k bezpečnosti viac založený na moderovaní. Inými slovami, niektoré bezpečnostné opatrenia boli skôr premyslené. OpenAI monitorovala, čo používatelia robili a aké otázky kládli, identifikovala nedostatky a pokúšala sa ich opraviť na cestách.
S GPT-4 je väčšina bezpečnostných opatrení už zapečená v systéme na úrovni modelu. Aby ste pochopili rozdiel, je to ako postaviť dom z robustných materiálov od začiatku v porovnaní s použitím čohokoľvek, čo ide, a potom sa snažiť opraviť veci, keď sa objavia chyby. Podľa Technická správa OpenAI GPT-4 [PDF], GPT-4 vyvoláva toxické reakcie iba 0,73 % času v porovnaní s GPT-3.5 6,48 % toxických odpovedí.
4. GPT-4 vs. GPT-3.5: Skutočnosť odozvy
Jednou z nedostatkov GPT-3.5 je jej tendencia dôverne produkovať nezmyselné a nepravdivé informácie. V žargóne AI sa to nazýva „halucinácia AI“ a môže spôsobiť nedôveru k informáciám generovaným AI.
V GPT-4 sú halucinácie stále problémom. Avšak podľa technickej správy GPT-4 má nový model o 19 % až 29 % menšiu pravdepodobnosť halucinácií v porovnaní s modelom GPT-3.5. Nejde však len o technickú správu. Odpovede z modelu GPT-4 na ChatGPT sú výrazne vecnejšie.
5. GPT-4 vs. GPT-3.5: Kontextové okno
Menej diskutovaným rozdielom medzi GPT-4 a GPT-3.5 je kontextové okno a veľkosť kontextu. Kontextové okno je množstvo údajov, ktoré si model môže uchovať vo svojej „pamäti“ počas chatovej relácie a ako dlho. GPT-4 má výrazne lepšiu veľkosť kontextu a okno ako jeho predchodca.
V praxi to znamená, že GPT-4 si dokáže dlhšie zapamätať kontext konverzácie, ako aj pokyny poskytnuté počas konverzácie.
Problém s GPT-3.5 je tendencia modelu ísť mimo tému alebo nedodržať pokyny, keď napredujete v priebehu konverzácie. Mohli by ste napríklad povedať modelke, aby vás oslovovala vaším menom, na chvíľu to urobí, ale potom nebude postupovať podľa pokynov. Aj keď tento problém stále existuje pri modeli GPT-4, je to menší problém kvôli lepšiemu kontextovému oknu.
Ďalším problémom je obmedzenie objemu textu, ktorý môžete naraz použiť vo výzve. Zhrnutie dlhého textu pomocou GPT-3 zvyčajne znamená rozdelenie textu na viacero častí a ich zhrnutie kúsok po kúsku. Zlepšenie dĺžky kontextu v modeli GPT-4 znamená, že môžete naraz prilepiť celé súbory PDF a nechať model zhrnúť bez toho, aby ste ho rozdelili na kúsky.
GPT-4: Krok nahor oproti GPT-3.5
GPT-4 je nepochybne významným krokom vpred od svojich predchodcov. Aj keď je stále sužovaný niektorými obmedzeniami GPT-3.5, významné zlepšenia v niekoľkých oblastiach a pridanie nových možností robí z modelu vzrušujúci nový krok v snahe o skutočne inteligentný jazyk AI modelov.