Modely GPT od OpenAI spôsobili revolúciu v spracovaní prirodzeného jazyka (NLP), ale pokiaľ neplatíte za prémiu prístup k službám OpenAI, nebudete môcť doladiť a integrovať ich modely GPT do vášho aplikácie. Okrem toho bude mať OpenAI prístup ku všetkým vašim konverzáciám, čo môže byť bezpečnostný problém, ak používate ChatGPT na podnikanie a iné citlivejšie oblasti vášho života. Ak vás to nezaujíma, možno budete chcieť vyskúšať GPT4All.
Čo teda vlastne GPT4All je? Ako to funguje a prečo ho používať cez ChatGPT?
Čo je GPT4All?
GPT4All je ekosystém s otvoreným zdrojovým kódom, ktorý sa používa na integráciu LLM do aplikácií bez platenia za predplatné platformy alebo hardvéru. Vytvorila ho spoločnosť Nomic AI, informačná kartografická spoločnosť, ktorej cieľom je zlepšiť prístup k zdrojom AI.
GPT4All je navrhnutý tak, aby fungoval na moderných až relatívne moderných počítačoch bez potreby pripojenia k internetu alebo dokonca GPU! Je to možné, pretože väčšina modelov poskytovaných GPT4All bola kvantovaná tak, aby mala len niekoľko gigabajtov a na spustenie si vyžaduje iba 4–16 GB RAM.
To umožňuje menším podnikom, organizáciám a nezávislým výskumníkom používať a integrovať LLM pre špecifické aplikácie. A keďže GPT4All sa dá jednoducho nainštalovať pomocou inštalačného programu na jedno kliknutie, ľudia teraz môžu používať GPT4All a mnohé z jej LLM na vytváranie obsahu, písanie kódu, pochopenie dokumentov a informácií zhromažďovanie.
Prečo používať GPT4ALL cez ChatGPT?
Existuje niekoľko dôvodov, prečo by ste mohli chcieť používať GPT4All cez ChatGPT.
- Prenosnosť: Modely poskytované GPT4All vyžadujú iba štyri až osem gigabajtov pamäte, na spustenie nevyžadujú GPU a možno ich jednoducho uložiť na USB flash disk pomocou inštalačného programu GPT4All na jedno kliknutie. Vďaka tomu je GPT4All a jeho modely skutočne prenosné a použiteľné na takmer akomkoľvek modernom počítači.
- Ochrana osobných údajov a zabezpečenie: Ako bolo vysvetlené vyššie, pokiaľ nemáte prístup k ChatGPT Plus, všetky vaše konverzie ChatGPT sú prístupné prostredníctvom OpenAI. GPT4All sa zameriava na transparentnosť údajov a súkromie; vaše údaje budú uložené iba na vašom miestnom hardvéri, pokiaľ ich zámerne nezdieľate so spoločnosťou GPT4All, aby ste pomohli rozšíriť ich modely.
- Režim offline: GPT je proprietárny model, ktorý vyžaduje prístup k API a neustále internetové pripojenie na dopytovanie alebo prístup k modelu. Ak stratíte internetové pripojenie alebo máte problém so serverom, nebudete mať prístup k ChatGPT. Toto nie je prípad GPT4All. Keďže všetky údaje sú už uložené v štvor- až osemgigabajtovom balíku a odvodzovanie sa vykonáva lokálne, na prístup k žiadnym modelom v GPT4All nepotrebujete internetové pripojenie. Môžete pokračovať v chatovaní a dolaďovaní svojho modelu aj bez internetového pripojenia.
- Voľný a otvorený zdroj: Niekoľko LLM poskytovaných GPT4All je licencovaných pod GPL-2. To umožňuje komukoľvek doladiť a integrovať svoje vlastné modely na komerčné použitie bez toho, aby musel platiť za licenciu.
Ako funguje GPT4All
Ako už bolo spomenuté vyššie, GPT4All je ekosystém používaný na školenie a nasadenie LLM lokálne na vašom počítači, čo je neuveriteľný výkon! Načítanie štandardného 25 – 30 GB LLM by zvyčajne vyžadovalo 32 GB RAM a GPU podnikovej triedy.
Pre porovnanie, LLM, ktoré môžete použiť s GPT4All, vyžadujú iba 3 GB – 8 GB úložného priestoru a môžu bežať na 4 GB – 16 GB RAM. Vďaka tomu je možné spustiť celý LLM na okrajovom zariadení bez potreby GPU alebo externej cloudovej asistencie.
Hardvérové požiadavky na spustenie LLM na GPT4All sa výrazne znížili vďaka kvantizácii neurónovej siete. Znížením hmotnosti presnosti a aktiváciami v neurónovej sieti možno mnohé modely poskytované GPT4All spustiť na väčšine relatívne moderných počítačov.
Tréningové údaje použité v niektorých dostupných modeloch boli zhromaždené prostredníctvom „hromady“, čo sú len zoškrabané údaje z verejne zverejneného obsahu na internete. Údaje sa potom odošlú do databázy Atlas AI spoločnosti Nomic AI, ktorú je možné vidieť na základe korelácií na ľahko viditeľnej 2D vektorovej mape (známej aj ako vektorovú databázu AI).
Tým, že spoločnosť Nomic AI trénovala model Groovy a využívala verejne dostupné údaje, dokázala spoločnosť Nomic AI vydať model s otvorenou licenciou GPL, ktorá umožňuje komukoľvek používať ho, dokonca aj pre komerčné aplikácie.
Ako nainštalovať GPT4All
Inštalácia GPT4All je jednoduchá a teraz, keď bola vydaná verzia 2 GPT4All, je ešte jednoduchšia! Najlepší spôsob, ako nainštalovať GPT4All 2, je stiahnuť si inštalačný program jedným kliknutím:
Stiahnuť ▼:GPT4All pre Windows, MacOS alebo Linux (zadarmo)
Nasledujúce pokyny sú pre Windows, ale GPT4All môžete nainštalovať na každý hlavný operačný systém.
Po stiahnutí dvakrát kliknite na inštalátor a vyberte Inštalácia. Program Windows Defender môže inštaláciu považovať za škodlivú, pretože proces poskytovania platných podpisov pre aplikácie tretích strán môže trvať dlho. To by sa však malo čoskoro napraviť. V čase písania, pokiaľ ste si stiahli aplikáciu GPT4All z oficiálnej webovej stránky, mali by ste byť v bezpečí. Kliknite na Napriek tomu nainštalovať na inštaláciu GPT4All.
Po otvorení aplikácie si budete musieť vybrať model, ktorý chcete použiť. GPT4ALL vám poskytuje niekoľko modelov, z ktorých všetky budú mať svoje silné a slabé stránky. Aby ste vedeli, ktorý model si stiahnuť, tu je tabuľka zobrazujúca ich silné a slabé stránky.
Model |
Veľkosť |
Poznámka |
Parametre |
Typ |
Kvantovanie |
---|---|---|---|---|---|
Hermes |
7,58 GB |
|
13 miliárd |
LLaMA |
q4_0 |
GPT4All Falcon |
3,78 GB |
|
7 miliárd |
Falcon |
q4_0 |
Groovy |
8 GB |
|
7 miliárd |
GPT-J |
q4_0 |
ChatGPT-3.5 Turbo |
Minimálne |
|
? |
GPT |
NA |
ChatGPT-4 |
Minimálne |
|
? |
GPT |
NA |
Snoozy |
7,58 GB |
|
13 miliárd |
LLaMA |
q4_0 |
MPT Chat |
4,52 GB |
|
7 miliárd |
MPT |
q4_0 |
Orca |
3,53 GB |
|
7 miliárd |
OpenLLaMA |
q4_0 |
Vicuna |
3,92 GB |
|
7 miliárd |
LLaMA |
q4_2 |
Čarodejník |
3,92 GB |
|
7 miliárd |
LLaMA |
q4_2 |
Wizard Uncensored |
7,58 GB |
|
13 miliárd |
LLaMA |
q4_0 |
Majte na pamäti, že poskytnuté modely majú rôzne úrovne obmedzení. Nie všetky modely je možné komerčne využívať zadarmo; niektoré budú potrebovať viac hardvérových prostriedkov, zatiaľ čo iné budú potrebovať kľúč API. Najmenej obmedzujúce modely dostupné v GPT4All sú Groovy, GPT4All Falcon a Orca.
Môžete trénovať všetky modely GPT4?
Áno, ale nie kvantované verzie. Ak chcete efektívne vyladiť modely GPT4All, musíte si stiahnuť surové modely a použiť GPU podnikovej triedy, ako napr. Instinct Accelerators od AMD alebo GPU Ampere alebo Hopper od NVIDIA. Okrem toho budete musieť model trénovať prostredníctvom školiaceho rámca AI, ako je LangChain, čo si bude vyžadovať určité technické znalosti.
Jemné doladenie modelu GPT4All si bude vyžadovať určité finančné prostriedky, ako aj určité technické know-how, ale ak chcete poskytnúť iba vlastné údaje modelu GPT4All, môžete pokračovať v trénovaní modelu prostredníctvom rozšíreného generovania vyhľadávania (ktoré pomáha jazykovému modelu pristupovať a porozumieť informáciám mimo jeho základného školenia na dokončenie úlohy). Môžete to urobiť tak, že pred položením otázky požiadate GPT4All o modelovanie vašich vlastných údajov. Vlastné údaje by sa mali ukladať lokálne a po zobrazení výzvy by vám model mal byť schopný poskytnúť informácie, ktoré ste raz poskytli.
Mali by ste používať GTP4All?
Myšlienkou GPT4All je poskytnúť bezplatnú platformu s otvoreným zdrojovým kódom, na ktorej môžu ľudia na svojich počítačoch spúšťať veľké jazykové modely. V súčasnosti sú GPT4All a jeho kvantované modely skvelé na experimentovanie, učenie sa a skúšanie rôznych LLM v bezpečnom prostredí. Pre profesionálne pracovné zaťaženie by sme stále odporúčali používať ChatGPT, pretože model je výrazne schopnejší.
Celkovo neexistuje žiadny dôvod, prečo by ste sa mali obmedziť na jeden. Keďže sa ich prípad použitia neprekrýva, mali by ste skúsiť použiť oboje.