GPT-4 je tu a toto sú nové funkcie, ktoré by ste si mali vyskúšať.
OpenAI konečne spustila svoju dlho očakávanú aktualizáciu GPT, GPT-4. Veľký jazykový model (LLM) prichádza s niekoľkými výkonnými novými funkciami a schopnosťami, ktoré už šokovali používateľov na celom svete.
Okrem toho, že je výrazne lepší ako GPT-3.5, existujúci LLM, ktorý poháňa virálny chatbot ChatGPT od OpenAI, dokáže GPT-4 rozumie zložitejším vstupom, má oveľa väčší limit zadávania znakov, má multimodálne možnosti a je údajne bezpečnejší použitie.
1. GPT-4 dokáže porozumieť zložitejším vstupom
Jednou z najväčších nových funkcií GPT-4 je jej schopnosť porozumieť zložitejším a nuansovaným výzvam. Podľa OpenAI, GPT-4 "vykazuje výkon na ľudskej úrovni v rôznych profesionálnych a akademických štandardoch."
Ukázalo sa to tým, že GPT-4 prešiel niekoľkými skúškami na ľudskej úrovni a štandardizovanými testami, ako sú SAT, BAR a GRE, bez špecifického školenia. GTP-4 nielenže rozumel a vyriešil tieto testy s relatívne vysokým skóre vo všeobecnosti, ale zakaždým porazil aj svojho predchodcu GPT-3.5.
Schopnosti porozumieť viac jemným vstupným výzvam napomáha aj skutočnosť, že GPT-4 má oveľa väčší limit slov. Nový model dokáže spracovať vstupné výzvy v rozsahu až 25 000 slov (pre kontext bol GPT-3.5 obmedzený na 8 000 slov). To priamo ovplyvní detaily, ktoré môžu používatelia vtlačiť do svojich výziev, a tým poskytne modelu oveľa viac informácií na prácu a vytvorí zdĺhavejšie výstupy.
GPT-4 tiež podporuje viac ako 26 jazykov vrátane jazykov s nízkymi zdrojmi, ako je lotyština, waleština a svahilčina. Pri porovnávaní s presnosťou na tri rany v benchmarku MMLU GPT-4 porazil GPT-3.5, ako aj iné popredné LLM ako PaLM a Chinchilla, pokiaľ ide o výkon v anglickom jazyku v 24 jazykoch.
2. Multimodálne schopnosti
Predchádzajúca verzia ChatGPT bol obmedzený len na textové výzvy. Naproti tomu jednou z najnovších funkcií GPT-4 sú jej multimodálne schopnosti. Model môže akceptovať textové aj obrázkové výzvy.
To znamená, že AI môže prijať obrázok ako vstup a interpretovať ho a rozumieť mu rovnako ako textovú výzvu. Táto funkcia zahŕňa všetky veľkosti a typy obrázkov a textu, vrátane kombinujúcich dokumentov, ručne kreslených náčrtov a dokonca aj snímok obrazovky.
Schopnosti čítania obrázkov GPT-4 však presahujú len ich interpretáciu. OpenAI to predviedla vo svojom vývojárskom streame (vyššie), kde poskytla GPT-4 ručne kreslenú maketu vtipnej webovej stránky. Model mal za úlohu napísať kód HTML a JavaScript, aby premenil maketu na webovú stránku a zároveň nahradil vtipy skutočnými.
GPT-4 napísal kód pri použití rozloženia špecifikovaného v makete. Po testovaní kód vytvoril funkčnú stránku so skutočnými vtipmi, ako môžete hádať. Znamená to Pokroky v AI budú znamenať koniec programovania? Nie celkom, ale stále je to funkcia, ktorá sa bude hodiť pri pomoci programátorom.
Akokoľvek sľubne sa táto funkcia zdá, je stále vo výskume a nie je verejne dostupná. Model navyše vyžaduje veľa času na spracovanie vizuálnych vstupov, pričom samotný OpenAI uvádza, že zrýchlenie môže vyžadovať prácu a čas.
3. Väčšia ovládateľnosť
OpenAI tiež tvrdí, že GPT-4 má vysoký stupeň ovládateľnosti. Tiež to sťažilo AI zlomiť postavu, čo znamená, že je menej pravdepodobné, že zlyhá, keď je implementovaná v aplikácii na hranie určitej postavy.
Vývojári môžu predpísať štýl a úlohu svojej AI opísaním smeru v „systémovej“ správe. Tieto správy umožňujú používateľom rozhrania API výrazne prispôsobiť používateľskú skúsenosť v určitých medziach. Keďže tieto správy sú zároveň najjednoduchším spôsobom „útek z väzenia“ modelu, pracujú aj na tom, aby boli bezpečnejšie. Ukážka pre GPT-4 potvrdila tento bod tým, že prinútila používateľa, aby sa pokúsil zabrániť tomu, aby GPT-4 bol učiteľom Socratic a odpovedal na jeho otázku. Modelka však odmietla zlomiť charakter.
4. Bezpečnosť
OpenAI strávil šesť mesiacov tvorbou GPT-4 bezpečnejšie a vyrovnanejšie. Spoločnosť tvrdí, že je o 82 % nižšia pravdepodobnosť, že bude reagovať na žiadosti o nevhodný alebo inak nepovolený obsah, o 29 % vyššia pravdepodobnosť, že reagovať v súlade s politikami OpenAI na citlivé požiadavky a o 40 % vyššia pravdepodobnosť, že vytvoria vecné odpovede v porovnaní s GPT-3.5.
Nie je to dokonalé a stále môžete očakávať, že z času na čas „halucinuje“ a vo svojich predpovediach sa môže mýliť. Iste, GPT-4 má lepšie vnímanie a predikčnú silu, ale stále by ste nemali slepo dôverovať AI.
5. Zlepšenia výkonu
Okrem hodnotenia výkonnosti modelu na ľudských skúškach OpenAI vyhodnotila robota aj na tradičných benchmarkoch navrhnutých pre modely strojového učenia.
Tvrdí, že GPT-4 „výrazne prekonáva“ existujúce LLM a „najmodernejšie modely“. Tieto benchmarky zahŕňajú už spomínané MMLU, AI2 Reasoning Challenge (ARC), WinoGrande, HumanEval a Drop, pričom všetky testujú individuálne schopnosti.
Podobné výsledky nájdete aj pri porovnávaní výkonu na základe kritérií akademického videnia. Spustené testy zahŕňajú VQAv2, TextVQA, ChartQA, AI2 Diagram (AI2D), DocVQA, Infographic VQA, TVQA a LSMDC, z ktorých všetky sú GPT-4 na vrchole. OpenAI však uviedla, že výsledky GPT-4 v týchto testoch „nereprezentujú plne rozsah jeho schopností“, keďže výskumníci stále nachádzajú nové a náročnejšie veci, s ktorými sa model môže vysporiadať.
Small Step pre GPT-4, Giant Leap pre AI
S väčšou presnosťou, bezpečnosťou používania a pokročilými funkciami bol GPT-4 uvoľnený pre verejnosť prostredníctvom mesačného predplatného ChatGPT+, ktorý stojí 20 mesačne. Okrem toho sa OpenAI spojila s rôznymi organizáciami s cieľom začať vytvárať produkty pre spotrebiteľov pomocou GPT-4. Microsoft Bing, Duolingo, Stripe, Be My Eyes a Khan Academy už implementovali GPT-4 do svojich produktov.
GPT-4 môže byť prírastkovou aktualizáciou oproti GPT-3.5, ale celkovo je to obrovská výhra pre AI. Keď sa model stáva prístupnejším pre priemerného používateľa aj vývojárov prostredníctvom jeho API, zdá sa, že bude dobrým prípadom pre implementácie LLM v rôznych oblastiach.