LangChain LLM je horúcou témou mesta. Získajte prehľad o tom, čo to je a ako s tým môžete začať.

So zavedením veľkých jazykových modelov (LLM) sa o spracovaní prirodzeného jazyka začalo hovoriť na internete. Nové aplikácie sa vyvíjajú denne vďaka LLM ako ChatGPT a LangChain.

LangChain je open-source Python framework, ktorý umožňuje vývojárom vyvíjať aplikácie založené na veľkých jazykových modeloch. Jeho aplikáciami sú chatboti, sumarizácia, generatívne otázky a odpovede a mnohé ďalšie.

Tento článok poskytne úvod do LangChain LLM. Bude pokrývať základné pojmy, ako sa porovnáva s inými jazykovými modelmi a ako s tým začať.

Pochopenie LangChain LLM

Pred vysvetlením, ako LangChain funguje, musíte najprv porozumieť ako fungujú veľké jazykové modely. Veľký jazykový model je typ umelej inteligencie (AI), ktorý využíva hlboké učenie trénovať modely strojového učenia na veľkých údajoch, ktoré pozostávajú z textových, numerických a kódových údajov.

Obrovské množstvo údajov umožňuje modelu naučiť sa existujúce vzorce a vzťahy medzi slovami, číslami a symbolmi. Táto funkcia umožňuje modelu vykonávať celý rad úloh, ako napríklad:

instagram viewer

  • Generovanie textu, jazykový preklad, tvorivé, technické a akademické písanie obsahu a presné a relevantné odpovede na otázky.
  • Detekcia objektov na obrázkoch.
  • Sumarizácia kníh, článkov a výskumných prác.

Najvýznamnejším obmedzením LLM je, že modely sú veľmi všeobecné. Táto funkcia znamená, že napriek ich schopnosti efektívne vykonávať niekoľko úloh môžu niekedy poskytnúť všeobecné odpovede na otázky alebo výzvy vyžadujúce odborné znalosti a hlboké znalosti domény namiesto konkrétnych odpovede.

Rámec LangChain, ktorý vyvinul Harrison Chase koncom roka 2022, ponúka inovatívny prístup k LLM. Proces začína predspracovaním textov datasetu jeho rozdelením na menšie časti resp súhrny. Súhrny sú potom vložené do vektorového priestoru. Model dostane otázku, prehľadá súhrny a poskytne vhodnú odpoveď.

Metóda predbežného spracovania LangChain je kritickou funkciou, ktorej sa nedá vyhnúť, pretože LLM sa stávajú výkonnejšími a náročnejšími na údaje. Táto metóda sa používa hlavne v prípadoch kódového a sémantického vyhľadávania, pretože poskytuje zber v reálnom čase a interakciu s LLM.

LangChain LLM vs. Iné jazykové modely

Nasledujúci porovnávací prehľad má za cieľ zdôrazniť jedinečné vlastnosti a možnosti, ktoré odlišujú LangChain LLM od iných existujúcich jazykových modelov na trhu:

  • Pamäť: Niekoľko LLM má krátku pamäť, čo zvyčajne vedie k strate kontextu, ak výzvy prekročia limit pamäte. LangChain však poskytuje predchádzajúce chatové výzvy a odpovede, čím rieši problém limitov pamäte. História správ umožňuje používateľovi opakovať predchádzajúce správy LLM, aby sa zrekapituloval predchádzajúci kontext.
  • Prepínanie LLM: V porovnaní s inými LLM, ktoré uzamknú váš softvér pomocou rozhrania API jedného modelu, LangChain poskytuje abstrakciu, ktorá zjednodušuje prepínanie LLM alebo integráciu viacerých LLM do vašej aplikácie. Je to užitočné, keď chcete aktualizovať svoje softvérové ​​​​možnosti pomocou kompaktného modelu, ako je napríklad StableLM od Stability AI z GPT-3.5 OpenAI.
  • integrácia: Integrácia LangChain do vašej aplikácie je v porovnaní s inými LLM jednoduchá. Poskytuje pracovné toky potrubia reťaze a agentov, čo vám umožní rýchlo začleniť LangChain do vašej aplikácie. Pokiaľ ide o lineárne potrubia, reťaze sú objekty, ktoré v podstate spájajú početné časti. Agenti sú pokročilejší a umožňujú vám vybrať si, ako majú komponenty interagovať pomocou obchodnej logiky. Môžete napríklad chcieť použiť podmienenú logiku na určenie ďalšieho postupu na základe výsledkov LLM.
  • Odovzdávanie údajov: Kvôli všeobecnej textovej povahe LLM je zvyčajne zložité odovzdať údaje do modelu. LangChain rieši tento problém pomocou indexy. Indexy umožňujú aplikácii importovať údaje v premenných formátoch a ukladať ich spôsobom, ktorý umožňuje poskytovať ich riadok po riadku LLM.
  • Odpovede: LangChain poskytuje nástroje výstupného analyzátora na poskytovanie odpovedí vo vhodnom formáte na rozdiel od iných LLM, ktorých modelová odpoveď pozostáva zo všeobecného textu. Pri používaní AI v aplikácii je uprednostňované mať štruktúrovanú odpoveď, proti ktorej môžete programovať.

Začíname s LangChain LLM

Teraz sa naučíte, ako implementovať LangChain v skutočnom scenári použitia, aby ste pochopili, ako to funguje. Pred začatím vývoja je potrebné nastaviť vývojové prostredie.

Nastavenie vývojového prostredia

Najprv, vytvoriť virtuálne prostredie a nainštalujte nižšie uvedené závislosti:

  • OpenAI: Integrácia GPT-3 API do vašej aplikácie.
  • LangChain: Integrácia LangChain do vašej aplikácie.

Pomocou pip spustite príkaz uvedený nižšie na inštaláciu závislostí:

 pipenv install langchain openai

Vyššie uvedený príkaz nainštaluje balíky a vytvorí virtuálne prostredie.

Importujte nainštalované závislosti

Najprv importujte potrebné triedy ako napr LLMChain, OpenAI, ConversationChain, a PromptTemplate z langchain balík.

od langchain importovať ConversationChain, OpenAI, PromptTemplate, LLMCain

od langchain.pamäť importovať ConversationBufferWindowMemory

Triedy LangChain načrtávajú a vykonávajú reťazce jazykových modelov.

Prístup k OpenAI API Key

Ďalej získajte kľúč OpenAI API. Ak chcete získať prístup ku kľúču API OpenAI, musíte mať účet OpenAI a potom prejsť na Platforma OpenAI API.

Na ovládacom paneli kliknite na ikonu Profil. Potom kliknite na Zobraziť kľúče API tlačidlo.

Ďalej kliknite na Vytvorte nový tajný kľúč tlačidlo na získanie nového kľúča API.

Zadajte požadovaný názov kľúča API.

Dostanete a tajný kľúč výzva.

Skopírujte a uložte kľúč API na bezpečnom mieste pre budúce použitie.

Vývoj aplikácie pomocou LangChain LLM

Teraz budete pokračovať vo vývoji jednoduchej chatovacej aplikácie takto:

# Prispôsobte šablónu LLM 
šablóna = Assistant je rozsiahly jazykový model vyškolený OpenAI.

{história}
Človek: {human_input}
Asistent:

prompt = PromptTemplate (input_variables=["história", "human_input"], template=template)

Ďalej načítate reťazec ChatGPT pomocou kľúča API, ktorý ste predtým uložili.

chatgpt_chain = LLMCain(

llm=OpenAI(openai_api_key="OPENAI_API_KEY",teplota=0),
výzva = výzva,
podrobný =Pravda,
memory=ConversationBufferWindowMemory (k=2),

)
# Predpovedajte vetu pomocou reťazca chatgpt
output = chatgpt_chain.predict(
human_input="Čo je MakeUseOf?"
)
# Zobrazte odpoveď modelu
tlač (výstup)

Tento kód načíta reťazec LLM s kľúčom OpenAI API a šablónou výzvy. Potom sa poskytne používateľský vstup a zobrazí sa jeho výstup.

Vyššie je očakávaný výstup.

Rastúci vplyv LLM

Spotreba LLM rýchlo rastie a mení spôsob, akým ľudia interagujú so znalostnými strojmi. Rámce ako LangChain sú v popredí poskytovania vývojárov plynulým a jednoduchým spôsobom poskytovania LLM aplikáciám. Generatívne modely AI ako ChatGPT, Bard a Hugging Face tiež nezostávajú pozadu v napredovaní aplikácií LLM.