OpenAI dala ChatGPT možnosť hovoriť pomocou syntetizovaného hlasu a čoskoro sa dostane aj do vášho smartfónu.

ChatGPT sa má stať interaktívnym generatívnym zážitkom AI. OpenAI odhalilo, že popredný svetový chatbot s umelou inteligenciou bude schopný hovoriť a odpovedať na otázky používateľov pomocou syntetizovaného, ​​pravdepodobne generovaného hlasu.

Spolu so svojím novo nájdeným hlasom bude ChatGPT tiež schopný reagovať a diskutovať o konkrétnych obrázkoch, ktoré sú doň nahrané alebo zachytené počas používania aplikácie ChatGPT pre Android alebo iOS. Funkcia rozpoznávania obrázkov znie podobne ako Google Lens a ďalšie aplikácie, ktoré používajú neurónové siete na presné zisťovanie údajov a informácií.

OpenAI dáva ChatGPT hlas

25. septembra 2023 vývojár ChatGPT OpenAI odhalené dal by hlas svojmu poprednému svetovému generatívnemu chatbotovi AI. Používatelia ChatGPT môžu hovoriť priamo s chatbotom a požiadať ho o spätné vyjadrenie, čo efektívne umožňuje ChatGPT prvýkrát konverzovať priamo hlasom.

instagram viewer

V ukážkovom klipe OpenAI je žena, ktorá žiada ChatGPT, aby vytvorila jedinečný príbeh pred spaním, na ktorý ChatGPT náležite odpovie ženským syntetizovaným hlasom.

Podľa Drôtové, nový model prevodu textu na reč bol vyvinutý interne. Dokáže generovať „ľudský“ zvuk z textu a niekoľkých sekúnd ukážkovej reči (pomocou modelu OpenAI Whisper) a hovoria rôznymi tónmi a štýlmi. Celý rad hlasových ukážok nájdete na Blog OpenAI.

Niektoré spoločnosti už používajú nový hlasový model OpenAI. Napríklad Spotify používa model prevodu textu na reč OpenAI na preklad podcastov do rôznych jazykov, pričom kombinuje schopnosť prekladu jazyka ChatGPT s jeho novou schopnosťou hovoriť.

Nový model prevodu textu na reč ChatGPT je k dispozícii iba predplatiteľom Plus a Enterprise, ktorí používajú oficiálne Aplikácie pre Android a iOS a ich uvedenie sa očakáva v priebehu nasledujúcich dvoch týždňov (od 25. 2023). Okrem toho je nová funkcia hlasu na začiatku obmedzená na angličtinu, aj keď by sme očakávali, že sa to rýchlo zmení.

ChatGPT dokáže rozpoznať a analyzovať obrázky a fotografie

Druhou časťou aktualizácie ChatGPT OpenAI je schopnosť analyzovať a rozprávať obrázky nahrané do nástroja. Možnosť vizuálnej analýzy obrazu bola uvedená v aktualizačných videách GPT-4, ale odvtedy sa o nej veľa nediskutovalo (Interpret kódu ChatGPT stranou).

ChatGPT teraz získava funkcie podobné Google Lens. Môžete nahrať obrázok do ChatGPT alebo odfotografovať pomocou fotoaparátu smartfónu v aplikácii ChatGPT, ktorý detailne obrázok rozšíri a v prípade potreby pridá ďalší kontext.

Nazvať to „podobné ako Google Lens“ je skutočne nespravodlivé. Schopnosť chatovať tam a späť o obrázku s cieľom získať viac informácií a kontextu ho robí mimoriadne užitočným pre širokú škálu nastavení. Je však dôležité si všimnúť drobné písmo, pričom OpenAI objasňuje, že má obmedzenú „schopnosť ChatGPT analyzovať a robiť priame vyhlásenia o ľuďoch“ z dôvodov ochrany súkromia a presnosti. Mohol by však nástroj „Who Is This“ založený na OpenAI v budúcnosti fungovať? (Dúfajme, že nie!)

Rovnako ako nový model prevodu textu na reč, OpenAI zavedie rozpoznávanie obrázkov v najbližších dvoch týždňoch, aj keď bude k dispozícii na všetkých platformách, nielen na aplikácii ChatGPT.

Súkromie, bezpečnosť a ďalšie problémy

Dôsledky hlasového ChatGPT sú výrazné. Iste, je to vzrušujúce. Schopnosť vytvoriť jedinečne syntetizovaný hlas pomocou príkladu krátkeho úryvku však prináša značné problémy so súkromím a bezpečnosťou. Potenciál zlomyseľných aktérov využiť tieto nástroje je obrovský a ako pri každom generatívnom nástroji AI, akonáhle je džin von z fľaše, už sa tam vôbec nevráti. Žiadna regulácia AI od vlád alebo myšlienkových lídrov nemôže zvrátiť príliv.

Zdá sa, že dokonca aj varovanie OpenAI na túto tému obchádza to, čo je zrejmé, napriek spomenutiu problémov:

Tieto schopnosti však predstavujú aj nové riziká, ako napríklad možnosť, že sa zlomyseľní aktéri budú vydávať za verejné osobnosti alebo spáchať podvod. To je dôvod, prečo túto technológiu používame na podporu konkrétneho prípadu použitia – hlasového chatu.

Vzhľadom na to, že toto je špička ľadovca, očakávajte odvolanie proti novoobjavenému hlasu ChatGPT, najmä raz existuje predvídateľný nárast nepríjemných titulkov, ktoré tvrdia, že ChatGPT sa používa na páchanie podvodov a tak na.

OpenAI robí z ChatGPT aplikáciu Go-To AI

Čím viac OpenAI pridáva do ChatGPT užívateľsky prívetivé funkcie, tým viac sa stáva generatívnou aplikáciou AI. ChatGPT ako prvý, kto dosiahol všeobecnú slávu počas počiatočného generatívneho boomu AI, stále vedie cestu a je iba aplikácia, ktorá sa používa, napriek konkurencii ako Google Bard (a potenciálne Google Gemini) a Anthropic's Claude.

Pokiaľ bude OpenAI pokračovať v pridávaní funkcií, ktoré uľahčujú používanie ChatGPT, udrží ľudí v napätí a bude sa stále viac približovať k svojmu cieľu, ktorým je skutočne multimodálny nástroj AI.