Tvorcovia ChatGPT majú ďalší nástroj, ktorého cieľom je zbaviť vaše prsty.

Tí istí ľudia, ktorí stoja za ChatGPT, vytvorili ďalší nástroj založený na AI, ktorý dnes môžete použiť na zvýšenie svojej produktivity. Máme na mysli Whisper, riešenie prevodu hlasu do textu, ktoré zatienilo všetky podobné riešenia, ktoré pred ním boli.

Whisper môžete použiť vo svojich programoch alebo v príkazovom riadku. A napriek tomu to marí jeho samotný účel: písanie bez klávesnice. Ak ho potrebujete písať, prečo ho používať, aby ste sa vyhli písaniu? Našťastie teraz môžete Whisper používať prostredníctvom grafického rozhrania pre stolné počítače. Ešte lepšie je, že dokáže prepísať váš hlas takmer v reálnom čase. Pozrime sa, ako môžete písať hlasom pomocou Whisper Desktop.

Čo je to Whisper OpenAI?

OpenAI's Whisper je systém automatického rozpoznávania reči (skrátene ASR) alebo, zjednodušene povedané, je riešením na konverziu hovoreného jazyka na text.

Na rozdiel od starších systémov diktovania a prepisu je však Whisper riešením AI vyškoleným na viac ako 680 000 hodinách reči v rôznych jazykoch. Whisper ponúka bezkonkurenčnú presnosť a čo je celkom pôsobivé, nielenže je viacjazyčný, ale dokáže prekladať aj medzi jazykmi.

instagram viewer

A čo je dôležitejšie, je to zadarmo a dostupné ako open source. Vďaka tomu mnohí vývojári rozdelili jeho kód do svojich vlastných projektov alebo vytvorili aplikácie, ktoré sa naň spoliehajú, ako napríklad Whisper Desktop.

Ak dávate prednosť „vanilkovej“ verzii Whisper a všestrannosti terminálu namiesto neohrabaných GUI, pozrite si náš článok o ako premeniť svoj hlas na text pomocou OpenAI Whisper pre Windows.

Sú Whisper a Whisper Desktop rovnaké?

Napriek svojmu oficiálnemu názvu je Whisper Desktop GUI tretej strany pre Whisper, vytvorené pre každého, kto uprednostňuje klikanie na tlačidlá namiesto písania príkazov.

Whisper Desktop je samostatné riešenie, ktoré sa nespolieha na existujúcu inštaláciu Whisper. Ako bonus používa alternatívnu, optimalizovanú verziu Whisper, takže by mala fungovať lepšie ako samostatná verzia.

Ste na druhom konci spektra a namiesto toho, aby ste hľadali jednoduchší spôsob použitia Whisper ako terminál, hľadáte spôsoby, ako ho implementovať do svojich vlastných riešení? Raduj sa, pre OpenAI otvorila prístup k rozhraniam ChatGPT a Whisper API.

Stiahnite si a nainštalujte Whisper Desktop

Hoci sa Whisper Desktop používa jednoduchšie ako samostatný Whisper, jeho inštalácia je komplikovanejšia ako opakované klikanie na Ďalej v sprievodcovi.

  1. Navštívte Oficiálna stránka Github spoločnosti Whisper Desktop. Pozrite sa vpravo a kliknite na najnovšiu verziu nižšie Vydania.
  2. Pod Aktíva, kliknite WhisperDesktop.zip a stiahnite si ho do PC.
  3. Rozbaľte stiahnutý archív do priečinka a pomocou správcu súborov ho navštívte. Vnútri nájdete aplikáciu Whisper Desktop. Dvojitým kliknutím naň ho spustíte.
  4. Potrebujete tiež jazykový model Whisper GCML binárny formát. Whisper Desktop vám poskytne dva odkazy na získanie jedného. Preskočte druhý odkaz na vytvorenie vlastného modelu, pretože je to komplikovanejší proces. Kliknite na Objímajúca tvár otvorte túto stránku vo svojom predvolenom prehliadači, odkiaľ si môžete stiahnuť súbor pripravený na použitie.
  5. Verzia Whisper Desktop, ktorú sme použili pri písaní tohto článku, poskytla odkaz na zastarané úložisko v Hugging Face. Ak narazíte na rovnaký problém, všimnite si odkaz na a nové umiestnenie. Kliknutím naň navštívite nové úložisko.
  6. Kliknite na odkaz, ktorý vás presmeruje na dostupné modelov.
  7. V tomto zozname kliknite na buď ggml-medium.bin alebo ggml-medium.en.bin, v závislosti od toho, či chcete viacjazyčnú alebo iba anglickú podporu v Whisper.
  8. Nakoniec by ste mali doraziť do cieľa. Všimnite si riadok, ktorý hovorí, že tento súbor je uložený v Git LFS a je príliš veľký na zobrazenie, ale stále si ho môžete stiahnuť. Kliknite na Stiahnuť ▼ urobiť presne to.
  9. Po dokončení sťahovania súboru použite svojho obľúbeného správcu súborov (urobí to Prieskumník) na presunutie stiahnutého súboru jazykového modelu do rovnakého priečinka ako Whisper Desktop.

Prepis pomocou Whisper Desktop

Prepis pomocou Whisper Desktop je jednoduchý, no na používanie aplikácie budete možno potrebovať jedno alebo dve kliknutia.

Znova spustite Whisper Desktop. Chýba (stále) správna cesta k vášmu stiahnutému jazykovému modelu? Klikni na tlačidlo s tromi bodkami na pravej strane poľa a ručne vyberte súbor, ktorý ste stiahli z Hugging Face.

Z tohto miesta môžete použiť aj rozbaľovaciu ponuku vedľa Implementácia modelu vybrať, či chcete spustiť Whisper na svojom GPU (GPU), na CPU aj GPU (Hybrid), alebo len na CPU (Odkaz).

The Pokročilé vedie k ďalším možnostiam, ktoré ovplyvňujú spôsob, akým bude Whisper fungovať na vašom hardvéri. Keďže však tlačidlo jasne uvádza, že sú pokročilé, odporúčame vám ich vyladiť len vtedy, ak riešite problémy alebo viete, čo robíte. Nastavením nesprávnych hodnôt možností tu môže byť uložený trest za výkon alebo môže byť aplikácia nepoužiteľná.

Kliknutím na OK sa presuniete do hlavného rozhrania aplikácie.

Ak už máte nahrávku svojho hlasu, ktorú chcete zmeniť na písaný text, kliknite na Prepis súboru a vyberte ho. Napriek tomu použijeme Whisper Desktop na živý prepis tohto článku.

Ponúkané možnosti sú jednoduché. Môžete si vybrať Jazyk Whisper použije, vyberte si, či chcete preložiť medzi jazykmi a povoľte aplikácie Konzola ladenia.

Väčšina anglicky hovoriacich používateľov môže tieto možnosti bezpečne preskočiť a zabezpečiť, aby bol vybratý správny zvukový vstup z rozbaľovacej ponuky vedľa položky Snímacie zariadenie.

Uisti sa Uložiť do textového súboru a Pripojte k tomuto súboru majú povolené, aby Whisper Desktop uložil svoj výstup do súboru bez prepísania jeho obsahu. Použi tlačidlo s tromi bodkami napravo od poľa cesty k súboru na definovanie uvedeného textového súboru.

Kliknite na Zachytiť aby ste začali prepisovať svoju reč na text.

Whisper Desktop vám ukáže tri indikátory, keď zistí hlasovú aktivitu, keď aktívne prepisuje a keď sa proces zastaví.

Môžete hovoriť tak dlho, ako chcete, a občas by ste mali vidieť blikať prvé dva indikátory, kým aplikácia zmení váš hlas na text. Kliknite Stop po dokončení.

Textový súbor, ktorý ste vybrali, by sa mal otvoriť vo vašom predvolenom textovom editore a mal by obsahovať v písomnej forme všetko, čo ste povedali, kým ste naň neklikli Stop.

Mali by sme poznamenať, že môžete urobiť aj opak toho, čo sme videli tu: previesť akýkoľvek text na reč. Týmto spôsobom môžete počúvať čokoľvek, ako keby to bol podcast, namiesto toho, aby ste unavili oči žmúrením na obrazovky. Viac informácií o tom nájdete v našom článku niektoré z najlepších bezplatných online nástrojov na sťahovanie prevodu textu na reč vo formáte MP3.

Tipy na písanie hlasom Whisper Desktop

Hoci Whisper Desktop môže byť záchrancom a umožňuje vám písať hlasom oveľa rýchlejšie, než by ste mohli písať, nie je to ani zďaleka dokonalé.

Počas nášho testovania sme zistili, že môže občas koktať, preskakovať niektoré slová, zlyhať pri prepise, kým sa vám nepodarí manuálne zastavte a reštartujte proces alebo uviaznite v slučke a znova prepisujte rovnakú frázu opakovane.

Veríme, že ide o dočasné chyby, ktoré budú opravené, pretože samostatný Whisper nevykazuje rovnaké problémy.

Okrem týchto drobných nerovností by premena hlasu na text s Whisper Desktop mala byť jednoduchá. Počas našich testov sme však zistili, že môže fungovať ešte lepšie, ak...

  1. Namiesto toho, aby ste vyslovili iba dve alebo tri slová a potom sa zastavili, Whisper vám lepšie porozumie, ak budete pokračovať dlhšie. Skúste tomu dať aspoň celú vetu naraz.
  2. Z rovnakého dôvodu sa vyhnite opakovanému spúšťaniu a zastavovaniu procesu prepisu.
  3. Kedykoľvek si uvedomíte, že ste urobili chybu, ignorujte ju a pokračujte. Zdá sa, že načítanie a uvoľnenie jazykového modelu je časovo najnáročnejšia časť procesu pri súčasnom stave Whisper a nášho dostupného hardvéru. Takže je rýchlejšie pokračovať v rozprávaní a potom opraviť svoje chyby.
  4. Rovnako ako v prípade samostatnej verzie Whisper je najlepšie použiť optimálny jazykový model pre váš dostupný hardvér. Môžete použiť až do stredná model, ak má váš GPU 8 GB VRAM. Pre menej VRAM si vyberte menšie modely. Vyberte si len o niečo presnejšie, ale aj oveľa náročnejšie veľký model, ak používate GPU s 16 GB VRAM alebo viac.
  5. Pamätajte, že čím väčší je jazykový model, tým pomalší je proces prepisu. Nevyberajte si model väčší, než je potrebné. Pravdepodobne zistíte, že Whisper Desktop vám už väčšinu času „rozumie“ so strednými alebo menšími modelmi, iba s jednou alebo dvoma chybami na odsek.

Stále píšete? Použite svoj hlas šepotom

Napriek tomu, že nastavenie si vyžaduje určitý čas, ako uvidíte, keď to vyskúšate, Whisper Desktop funguje oveľa lepšie ako väčšina alternatív, s oveľa vyššou presnosťou a vyššou rýchlosťou.

Keď ju začnete používať na písanie hlasom, vaša klávesnica môže vyzerať ako relikvia z dávnych čias.