Pred viac ako 70 rokmi, keď sa konceptualizovala umelá inteligencia, Alan Turing publikoval dokument, ktorý opísal, ako ju identifikovať. Neskôr bol známy ako Turingov test a už desaťročia sa používa na rozlíšenie medzi človekom a AI.

So zavedením pokročilých chatbotov AI, ako sú ChatGPT a Google Bard, je však čoraz ťažšie zistiť, či hovoríte s AI. To vyvoláva otázku; je Turingov test zastaraný? A ak áno, aké sú alternatívy?

Je Turingov test zastaraný?

Fotografický kredit: Jesus Sanz/Shutterstock

Ak chcete zistiť, či je Turingov test zastaraný, musíte najprv pochopiť, ako to funguje. Aby AI prešla Turingovým testom, musí presvedčiť ľudského vyšetrovateľa, že je to človek. Má to však háčik – AI sa hodnotí spolu s človekom a musí reagovať pomocou textu.

Myslite na to takto; ak ste vyšetrovateľ a kladiete otázky dvom účastníkom online pomocou textu, ale jeden z nich je model AI – rozlíšili by ste ich po piatich minútach? Majte na pamäti, že cieľom Turingovho testu nie je identifikovať model AI na základe správnych odpovedí, ale posúdiť, či AI dokáže myslieť alebo sa správať ako človek.

instagram viewer

Problém s prístupom Turingovho testu, ktorý spočíva iba v identifikácii ľudských reakcií, je v tom, že nezohľadňuje iné faktory. Napríklad inteligencia modelu AI alebo znalosti vyšetrovateľa. Okrem toho je Turingov test obmedzený len na text a je čoraz ťažšie identifikovať AI, ktorá generuje ľudský hlas alebo deepfake videá, ktoré napodobňujú ľudské správanie.

Súčasné modely AI, ako sú ChatGPT-4 a Google Bard, však ešte nepokročili do bodu, v ktorom by mohli konzistentne prejsť Turingovým testom. V skutočnosti, ak ste oboznámení s AI, môžete bodový text vygenerovaný AI.

5 najlepších alternatív Turingovho testu

Je to možné budúce modely AI ako ChatGPT-5 mohol prejsť Turingovým testom. Ak sa tak stane, budeme potrebovať rôzne testy kombinované s Turingovým testom, aby sme zistili, či hovoríme s AI alebo s človekom. Tu sú najlepšie alternatívy Turingovho testu:

1. Marcusov test

Gary Marcus, uznávaný kognitívny vedec a výskumník AI, navrhol alternatívu k Turingovmu testu, ktorý bol publikovaný v New Yorker identifikovať kognitívne schopnosti AI. Test je jednoduchý – posudzujete model AI na základe jeho schopnosti sledovať a porozumieť videám a televíznym reláciám YouTube bez titulkov alebo textu. Aby AI prešla Marcusovým testom, mala by pri sledovaní videí rozumieť sarkazmu, humoru, irónii a dejovej línii a vysvetliť to ako človek.

Práve teraz, GPT-4 môže popisovať obrázky, ale zatiaľ neexistuje žiadny model AI, ktorý by dokázal porozumieť videám ako človek. Samojazdiace vozidlá priblížiť, ale nie sú úplne autonómne a vyžadujú senzory, pretože nedokážu pochopiť všetko v okolitom prostredí.

2. Vizuálny Turingov test

Podľa výskumnej práce zverejnenej na PNASVizuálny Turingov test možno použiť na zistenie, či hovoríte s človekom alebo s AI pomocou obrázkových dotazníkov. Funguje to ako Turingov test, ale namiesto odpovedí na otázky pomocou textov sa účastníkom zobrazujú obrázky a očakáva sa, že budú odpovedať na jednoduché otázky, pričom budú rozmýšľať ako človek. Avšak, vizuálny Turingov test sa líši od obrázkov CAPTCHA keďže všetky odpovede sú správne – ale aby test prešiel, AI musí spracovať obrázky podobne ako človek.

Okrem toho, ak sa AI a človeku zobrazí viacero obrázkov vedľa seba a požiada sa, aby identifikovali realistické obrázky, človek by mal kognitívnu schopnosť prejsť testom. Je to preto, že pre modely AI je ťažké rozlíšiť obrázky, ktoré nevyzerajú ako nasnímané v skutočnom svete. V skutočnosti je to dôvod, prečo môžete identifikovať obrázky generované AI pomocou anomálií, ktoré nedávajú zmysel.

3. Test Lovelace 2.0

Teóriu, že počítač nemôže vytvárať originálne nápady nad rámec toho, na čo bol naprogramovaný, prvýkrát konceptualizovala Ada Lovelace pred Turingovým testom. Alan Turing však namietal proti tejto teórii a tvrdil, že AI môže stále prekvapiť ľudí. Až v roku 2001 boli vyvinuté pokyny pre test Lovelace, aby bolo možné odlíšiť AI od človeka – a podľa thekurzweillibrary pravidlá boli neskôr revidované v roku 2014.

Aby umelá inteligencia prešla testom Lovelace, musí preukázať, že dokáže generovať originálne nápady, ktoré presahujú jej školenie. Súčasné modely AI, ako je GPT-4, nemajú schopnosť prísť s novými vynálezmi nad rámec našich existujúcich vedomostí. však umelá všeobecná inteligencia môže dosiahnuť túto schopnosť a prejsť testom Lovelace.

4. Reverzný Turingov test

A čo Turingov test, ale urobený naopak? Namiesto toho, aby ste sa snažili zistiť, či hovoríte s človekom, cieľom je reverzný Turingov test je oklamať AI, aby uverila, že ste AI. Na zodpovedanie rovnakých otázok pomocou textu však potrebujete aj iný model AI.

Ak je napríklad vyšetrovateľ ChatGPT-4, môžete ako účastníkov zaregistrovať Google Barda a ďalšieho človeka. Ak model AI dokáže na základe odpovedí správne identifikovať ľudského účastníka, prešiel testom.

Nevýhodou reverzného Turingovho testu je, že je nespoľahlivý, najmä vzhľadom na to, že niekedy AI nedokáže odlíšiť generovanú AI a obsah písaný človekom.

5. Klasifikačný rámec AI

Podľa klasifikačného rámca AI vyvinutého spoločnosťou Chris SaadTuringov test je len jednou z metód hodnotenia, ako zistiť, či hovoríte s AI. Presnejšie povedané, klasifikačný rámec AI je založený na teórii viacnásobnej inteligencie, ktorá vyžaduje, aby ľudská inteligencia spĺňala najmenej osem rôznych kritérií, ktoré zahŕňajú: hudobno-rytmickú, logicko-matematickú inteligenciu, vizuálnu identifikáciu, emocionálnu inteligenciu, sebareflexívnu inteligenciu, schopnosť existenciálneho myslenia a telo pohyb.

Keďže AI sa vyhodnocuje na základe ôsmich rôznych parametrov, je nepravdepodobné, že by obstála u človeka, aj keď v určitých benchmarkoch funguje lepšie ako priemer. napr. ChatGPT dokáže vyriešiť matematické problémy, popisovať obrázky a konverzovať v prirodzenom jazyku ako človek, ale v iných kategóriách definovaných v rámci klasifikácie AI by to zlyhalo.

Turingov test nie je presvedčivý

Turingov test mal byť skôr myšlienkovým experimentom než presvedčivým testom na rozlíšenie medzi ľuďmi a AI. Keď bol pôvodne navrhnutý, bol kľúčovým meradlom pre meranie inteligencie strojov.

S nedávnym vývojom modelov AI s rečovými, vizuálnymi a sluchovými interaktívnymi schopnosťami však Turingov test zaostáva, pretože je obmedzený na textovú konverzáciu. Najúčinnejším riešením by bolo zaviesť alternatívy Turingovho testu, ktoré ďalej odlišujú modely AI od ľudí.