Po spustení ChatGPT v novembri 2022 sa fenomenálny chatbot AI stal jedným z najdôveryhodnejších nástrojov na písanie na internete. Je to jednoduché na použitie; opíšte, čo potrebujete napísať, a ChatGPT to za pár sekúnd vytlačí na obrazovku.
Avšak v dobe, kedy sa text vygenerovaný umelou inteligenciou odovzdáva ako písaný človekom a používa sa na získanie nespravodlivej výhody, je identifikácia obsahu umelej inteligencie veľmi dôležitá. ChatGPT však nedokáže presne rozpoznať obsah AI, dokonca ani svoju vlastnú prácu – ale prečo?
Existuje rozdiel medzi textom AI a ľudským písaním?
Predpokladom na to, aby ChatGPT rozpoznal svoje vlastné písanie alebo akýkoľvek text vygenerovaný AI, je, že medzi ním a textom napísaným človekom musí byť rozdiel. Existuje teda nejaký významný rozdiel medzi textom napísaným človekom a obsahom generovaným AI? Ak existuje, určite by to mal byť schopný rozpoznať nástroj ako ChatGPT.
Napísali sme krátky príbeh bez akéhokoľvek vstupu z akéhokoľvek nástroja AI a potom sme sa spýtali ChatGPT, či bol príbeh obsahom napísaný AI. ChatGPT to s istotou označil ako text vygenerovaný AI.
Potom sme požiadali ChatGPT, aby vygeneroval príbeh, a v tom istom vlákne chatu sme vygenerovaný text skopírovali a vložili a spýtali sme sa ChatGPT, či bol text vytvorený AI. Odpoveď ChatGPT? Sebavedomé "Nie."
ChatGPT zlyhal pri identifikácii textu napísaného človekom alebo vygenerovaného AI v oboch prípadoch. Tak ako to, že ChatGPT nedokáže rozpoznať svoj vlastný text? Znamená to, že medzi AI a ľudským textom nie je žiadny rozdiel?
Nuž, existuje. O rozdieloch medzi nimi by sme mohli napísať celú knihu, ale na tom nebude záležať. Ak teda existuje rozdiel, prečo ChatGPT alebo akýkoľvek iný nástroj AI nedokáže identifikovať tieto rozdiely a presne poukázať na text vygenerovaný AI od textu napísaného človekom? Odpoveď spočíva v ako ChatGPT funguje a ako generuje text.
Ako ChatGPT generuje text
Keď požiadate ChatGPT, aby vygeneroval text, pokúsi sa napodobniť proces ľudského písania. Po prvé, model, ktorý stojí za ChatGPT – Generative Pre-trained Transformer (GPT) – bol trénovaný na veľkom korpuse ľudského textu. Všetko od e-mailov, článkov o zdraví, technických článkov, stredoškolských esejí a takmer akéhokoľvek textu, ktorý nájdete online, bolo odovzdané modelke počas tréningu. ChatGPT teda chápe, ako by mal byť každý z týchto typov textov napísaný.
Ak požiadate ChatGPT, aby napísal e-mail vášmu šéfovi, vie, ako by mal takýto e-mail vyzerať, pretože bol vyškolený na podobných e-mailoch – pravdepodobne ich sú tisíce. Podobne, ak ho požiadate, aby napísal stredoškolskú esej, tiež vie, ako by mala znieť stredoškolská esej. ChatGPT sa pokúsi napísať čokoľvek, čo chcete, aby to napísal človek.
Má to však háčik. Na rozdiel od toho, ako ľudia píšu, ChatGPT v skutočnosti nerozumie tomu, čo píše, spôsobom, akým by to pochopil človek. Namiesto toho sa chatbot pokúša predpovedať, aké by bolo najpravdepodobnejšie ďalšie slovo vo vete, kým nedokončí zápis.
Ako ChatGPT píše podľa predpovedí
Povedzme, že požiadate ChatGPT, aby napísal príbeh o fiktívnom meste Volkra. Existuje obrovská možnosť, že chatbot začne príbeh slovami „Kedysi“. Je to preto, že chatbot nemyslí za sám, ale snaží sa predpovedať, čo by človek napísal na základe toho, čo sa naučil z tisícok príbehov, počas ktorých bol kŕmený školenia.
Takže v domnienke, že človek by pravdepodobne začal príbeh slovami „Once upon“, ChatGPT by sa potom pokúsil predpovedať ďalšie logické slovo, ktoré by byť „a“, za ktorým nasleduje „čas“. Takže by ste mali "Bolo raz ..." nasledované ďalším logickým slovom a ďalším, kým sa príbeh nedokončí. ChatGPT v podstate píše tak, že predpovedá, aké slovo by prirodzene (alebo prinajmenšom s najväčšou pravdepodobnosťou) nasledovalo vo vete a vložilo ho.
Keď sa teda nástroj AI pokúša zistiť, či je text vygenerovaný AI, jedným z kritérií, ktoré sa snaží zvážiť, je predvídateľnosť textu, pretože nástroje AI píšu predikciou. Táto miera predvídateľnosti sa v jazyku AI nazýva zmätok. Teraz, keď je okrem iných kritérií prezentovaný text, nástroj AI, ako je ChatGPT, sa pokúša analyzovať text, aby zmeral predvídateľnosť sekvencie slov alebo viet v texte. Väčšia predvídateľnosť alebo nízka zložitosť zvyčajne znamená, že text je pravdepodobne generovaný AI. Menšia predvídateľnosť alebo vyššia zložitosť zvyčajne znamená, že text pravdepodobne napísali ľudia.
Tieto kritériá spolu s ďalšími faktormi, ako je úroveň kreativity textu, bohužiaľ nestačia na to, aby sme s istotou zistili, či je text napísaný nástrojom AI alebo nie. Je to preto, že ľudia môžu písať s väčšou variabilitou, ako je to vo vzorovom texte, ktorý sme použili na demonštráciu na začiatku tohto článku.
Chatboty AI ako ChatGPT sú navrhnuté tak, aby čo najviac napodobňovali prirodzený ľudský jazyk. Takže zatiaľ čo text AI môže mať rozoznateľné vzory, tieto vzory nie sú také zrejmé ani pre výkonný nástroj, akým je ChatGPT. To je dôvod, prečo ChatGPT nedokáže rozpoznať svoje vlastné písanie, rovnako ako prečo nástroje na detekciu textu AI nefungujú.
Rozpozná ChatGPT v budúcnosti svoje vlastné písanie?
V súčasnosti nástroje ako ChatGPT nedokážu zistiť, či bol text napísaný sám alebo iným nástrojom AI, pretože v obsahu generovanom AI neexistuje žiadny jasný a rozpoznateľný vzor. Je však veľká šanca, že sa to čoskoro zmení. Vďaka snahe spoločností ako ChatGPT zaviesť digitálne vodoznaky do obsahu generovaného ChatGPT bude text generovaný chatbotom zreteľnejší.