Chcete poskytnúť ChatGPT svoje vlastné údaje? Tu je krok za krokom, ako to urobiť!
ChatGPT, ktorý poskytuje technológiu GPT vo výkonnom a ľahko použiteľnom chatbote, sa stal svetovo najpopulárnejším nástrojom AI. Mnoho ľudí používa ChatGPT na poskytovanie pútavých konverzácií, odpovedanie na otázky, ponúkanie kreatívnych návrhov a pomoc pri kódovaní a písaní. Služba ChatGPT je však obmedzená, pretože nemôžete ukladať svoje údaje na dlhodobé osobné použitie a jej hraničný bod pre údaje v septembri 2021.
Ako riešenie môžeme použiť API OpenAI a LangChain, aby sme ChatGPT poskytli vlastné údaje a aktualizované informácie za rok 2021 na vytvorenie vlastnej inštancie ChatGPT.
Prečo poskytovať ChatGPT s vlastnými údajmi?
Kŕmenie ChatGPT vlastnými údajmi a poskytovanie aktualizovaných informácií po dátume uzávierky vedomostí poskytuje niekoľko výhod oproti bežnému používaniu ChatGPT. Tu je niekoľko z nich:
- Personalizované interakcie: Poskytnutím vlastných údajov ChatGPT môžu používatelia vytvoriť prispôsobenejšie prostredie. Model možno trénovať na špecifických súboroch údajov relevantných pre jednotlivých používateľov alebo organizácie, výsledkom čoho sú odpovede prispôsobené ich jedinečným potrebám a preferenciám.
- Odbornosť pre konkrétnu doménu: Vlastná integrácia údajov umožňuje ChatGPT špecializovať sa na konkrétne domény alebo odvetvia. Môže sa trénovať na znalostiach, terminológii a trendoch špecifických pre dané odvetvie, čo umožňuje presnejšie a presnejšie odpovede v týchto špecifických oblastiach.
- Aktuálne a presné informácie: Prístup k aktualizovaným informáciám zaisťuje, že ChatGPT zostane aktuálny s najnovším vývojom a poznatkami. Dokáže poskytnúť presné odpovede na základe nedávnych udalostí, správ alebo výskumu, vďaka čomu je spoľahlivejším zdrojom informácií.
Teraz, keď ste pochopili dôležitosť poskytovania vlastných údajov pre ChatGPT, tu je krok za krokom, ako to urobiť na lokálnom počítači.
Krok 1: Nainštalujte a stiahnite softvér a vopred pripravený skript
Upozorňujeme, že nasledujúce pokyny sú pre počítač so systémom Windows 10 alebo Windows 11.
Ak chcete poskytnúť vlastné údaje ChatGPT, budete si musieť nainštalovať a stiahnuť najnovší Python3, Git, Microsoft C++ a skript na vyhľadávanie ChatGPT z GitHub. Ak už máte v počítači nainštalovaný nejaký softvér, uistite sa, že je aktualizovaný na najnovšiu verziu, aby ste predišli akýmkoľvek problémom počas procesu.
Začnite inštaláciou:
- Stiahnuť ▼:Python3 (Zadarmo)
- Stiahnuť ▼:Git (Zadarmo)
- Stiahnuť ▼:Microsoft Visual Build Tools (Zadarmo)
Poznámky k inštalácii Python3 a Microsoft C++
Pri inštalácii Pythonu3 sa uistite, že ste zaškrtli Pridajte python.exe do PATH možnosť pred kliknutím Nainštalovať teraz. Je to dôležité, pretože vám to umožňuje prístup k Pythonu v akomkoľvek adresári na vašom počítači.
Pri inštalácii Microsoft C++ budete chcieť nainštalovať Nástroje na zostavenie Microsoft Visual Studio najprv. Po nainštalovaní môžete zaškrtnúť Vývoj desktopov v C++ možnosť a kliknite na tlačidlo Inštalácia so všetkými voliteľnými nástrojmi automaticky zaškrtnutými na pravom bočnom paneli.
Teraz, keď máte nainštalované najnovšie verzie Python3, Git a Microsoft C++, môžete si stiahnuť skript Python a jednoducho vyhľadávať vlastné lokálne údaje.
Stiahnuť ▼: Skript na vyhľadávanie ChatGPT (Zadarmo)
Ak chcete skript stiahnuť, kliknite na kód, potom vyberte Stiahnite si ZIP. Toto by malo stiahnuť skript Python do vášho predvoleného alebo vybraného adresára.
Po stiahnutí už môžeme nastaviť lokálne prostredie.
Krok 2: Nastavte miestne prostredie
Ak chcete nastaviť prostredie, budete musieť otvoriť terminál v priečinku chatgpt-retrieval-main, ktorý ste si stiahli. Ak to chcete urobiť, otvorte chatgpt-retrieval-main priečinok, kliknite pravým tlačidlom myši a vyberte Otvoriť v termináli.
Keď je terminál otvorený, skopírujte a prilepte tento príkaz:
pip install langchain openai chromadb tiktoken neštruktúrovaný
Tento príkaz používa správcu balíkov Pythonu vytvárať a spravovať virtuálne prostredie Python potrebné.
Po vytvorení virtuálneho prostredia musíme dodať kľúč OpenAI API na prístup k ich službám. Najprv budeme musieť vygenerovať kľúč API z Stránka kľúčov OpenAI API kliknutím na Vytvorte nový tajný kľúč, pridaním názvu kľúča a následným stlačením tlačidla Tlačidlo na vytvorenie tajného kľúča.
Dostanete reťazec znakov. Toto je váš kľúč OpenAI API. Skopírujte ho kliknutím na ikonu kopírovania na strane kľúča API. Majte na pamäti, že tento kľúč API by mal zostať v tajnosti. Nezdieľajte ho s ostatnými, pokiaľ naozaj nemáte v úmysle, aby ho používali s vami.
Po skopírovaní sa vráťte do hlavného priečinka chatgpt-retrieval-main a otvorte konštanty pomocou Poznámkový blok. Teraz nahraďte zástupný symbol svojím kľúčom API. Nezabudnite uložiť súbor!
Teraz, keď ste úspešne nastavili svoje virtuálne prostredie a pridali svoj kľúč OpenAI API ako premennú prostredia. Teraz môžete poskytnúť svoje vlastné údaje ChatGPT.
Krok 3: Pridanie vlastných údajov
Ak chcete pridať vlastné údaje, umiestnite všetky svoje vlastné textové údaje do údajov priečinok v rámci chatgpt-retrieval-main. Formát textových údajov môže byť vo forme PDF, TXT alebo DOC.
Ako môžete vidieť na obrázku vyššie, pridal som textový súbor obsahujúci vytvorený osobný rozvrh, článok, na ktorý som napísal Instinct Accelerators od AMDa dokument PDF.
Krok 4: Dopytovanie ChatGPT cez terminál
Skript Python nám umožňuje vyhľadávať údaje z vlastných údajov, ktoré sme pridali do priečinka s údajmi a na internet. Inými slovami, budete mať prístup k obvyklému backendu ChatGPT a všetkým údajom uloženým lokálne v priečinku s údajmi.
Ak chcete použiť skript, spustite python chatgpt.py skript a potom pridajte svoju otázku alebo dotaz ako argument.
pytón chatgpt.py "TVOJA OTÁZKA"
Nezabudnite dať svoje otázky do úvodzoviek.
Aby som otestoval, či sme úspešne naplnili naše údaje ChatGPT, položím osobnú otázku týkajúcu sa Osobný súbor Sched.txt súbor.
Fungovalo to! To znamená, že ChatGPT dokázal prečítať súbor Personal Sched.txt poskytnutý skôr. Teraz sa pozrime, či sme úspešne nakŕmili ChatGPT informáciami, ktoré nepozná kvôli dátumu uzávierky vedomostí.
Ako môžete vidieť, správne opísal AMD Instinct MI250x, ktorý bol vydaný po dátume ukončenia znalostí ChatGPT -3.
Obmedzenia Custom ChatGPT
Aj keď pridávanie vlastných údajov GPT-3.5 otvára viac spôsobov použitia a používania LLM, existuje niekoľko nevýhod a obmedzení.
Najprv musíte poskytnúť všetky údaje sami. Stále máte prístup ku všetkým znalostiam GPT-3.5 až do dátumu uzávierky znalostí; musíte však poskytnúť všetky ďalšie údaje. To znamená, že ak chcete, aby váš miestny model vedel o určitej téme na internete, ktorú GPT-3.5 ešte nepozná, budete musieť ísť na internet a sami zoškrabať údaje a uložiť ich ako text do priečinka s údajmi chatgpt-retrieval-main.
Ďalším problémom je, že načítanie dopytu ChatGPT takto trvá dlhšie v porovnaní s priamym dopytovaním ChatGPT.
A napokon jediným dostupným modelom je GPT-3.5 Turbo. Takže aj keď máte prístup k GPT-4, nebudete ho môcť použiť na napájanie vlastnej inštancie ChatGPT.
Vlastný ChatGPT je úžasný, ale obmedzený
Poskytovanie vlastných údajov ChatGPT je účinný spôsob, ako z modelu vyťažiť viac. Prostredníctvom tejto metódy môžete do modelu pridať ľubovoľné textové údaje, ktoré chcete, a vyzvať ho rovnako ako bežný ChatGPT, aj keď s určitými obmedzeniami. To sa však v budúcnosti zmení, pretože bude jednoduchšie integrovať naše údaje s LLM spolu s prístupom k najnovšiemu modelu GPT-4.