Určite ste už videli aplikácie, ktoré tvrdia, že prekladajú to, čo hovorí vaša mačka. Ale môžu skutočne preložiť mňau mňau do angličtiny? Krátka odpoveď je tak trochu áno. Je to ťažké kvôli tomu, aký jedinečný je „jazyk“ každej mačky, ale s modernou technológiou sa môžu pekne zblížiť.
Aplikácie pre preklady mačiek, ako napríklad MeowTalk, používajú formu rozpoznávania reči, ktorá kladie dôraz na strojové učenie. Pozrime sa bližšie.
Rozpoznávanie reči a strojové učenie
Rozpoznávanie reči funguje tak, že sa zaznamená reč a zvuk sa zmení na digitálny dátový súbor. Kóduje dáta, ako je výška tónu a objem, ako dátové body, ktoré môže aplikácia analyzovať a priradiť k významom. Mikrofóny DPA vysvetľuje, že tieto údajové body môžu vyzerať veľmi odlišne v závislosti od zvukov pozadia a spôsobu rozprávania slova.
Niekedy považujeme rozpoznávanie hlasu za samozrejmosť, ale je to neuveriteľný technologický počin. Najmä vzhľadom na to, aká zložitá je ľudská reč. Ako Vedec
vysvetľuje, každé slovo zahŕňa širokú škálu zvukov alebo „foném“, ktoré sú navzájom spojené. Dostať počítač do porozumenia reči je veľmi ťažké. Nová hranica mačacích zvukov bude ešte ťažšia.Aplikácie, ktoré využívajú rozpoznávanie reči, sú naprogramované na „slovnú zásobu“ slov, ktorá sa nazýva množina údajov. Aplikácia potom priradí váš prejav k najbližšej možnosti v dátovom slovníku.
Ak urobí chybu, opravíte ju a údaje sa uložia nabudúce. Toto je súčasť strojového učenia. Takto sa program naučí rozpoznávať reč, aj keď nie je totožný so súborom údajov, s ktorým začal.
Súvisiace: Čo sú algoritmy strojového učenia? Takto fungujú
Rozpoznávanie hlasu má stále problémy, najmä s rečovými vadami a akcentmi. Niektoré spoločnosti sú zlepšenie strojového učenia na prekonanie týchto problémov, predsa. V priebehu času sa pomocou strojového učenia stane z rozpoznávania reči výkonný nástroj.
Takto funguje rozpoznávanie reči u ľudí. Funguje to však na mačky?
Rozpoznávanie reči vs. Uznanie mňau
Najprv musíme pochopiť, prečo sa preklad určitého druhu mňau ako „mám hlad“ líši od analýzy ľudskej reči. Problém je väčšinou v tom, že komunikácia mačiek sa viac spolieha na neverbálne podnety, ako je držanie tela. Ďalším problémom je absencia univerzálneho „mačacieho jazyka“.
Podľa ASPCA„Dospelé divoké mačky na seba nikdy nekúria, iba na ľudí. Iný výskum, ktorý uskutočnil humánna spoločnosť dodáva, že tieto zvuky „sa nevyskytujú vo vákuu“. Musíme ich interpretovať spolu s rečou tela a inými kontextmi. V mnohých prípadoch sú tieto tiché signály jediným rozdielom medzi mňaukaním, ktoré znamená „mám hlad“, a tým, čo znamená „chcem sa hrať“.
K tomuto problému sa pridávajú ďalšie dve mačky, ktoré nemajú rovnaký jazyk. Mačky pre svojich majiteľov vyvíjajú personalizované „jazyky“. Tie sú čiastočne založené na imitácii hlasu majiteľa a čiastočne na osobnosti mačky. Žiadne dve mačky neznejú rovnako, dokonca ani vtedy, keď vyjadrujú rovnakú potrebu alebo potrebu. Ako je teda možné preložiť rečový slovník jednej aplikácie pre všetky z nich?
Flexibilné strojové učenie pre mačky
Aj keď pár virtuálnych asistentov má rád Oto pokus o porozumenie tónu a emócii, rozpoznávanie reči je pri neverbálnych signáloch stále hrozné. To však neznamená, že je nemožné ich interpretovať.
MeowTalk používa pružnejší druh strojového učenia, aby pomohol prekonať tieto problémy.
Stiahnuť ▼: MeowTalk pre Android | iOS (Zadarmo)
Meowtalk vytvoril Javier Sanchez, ktorý pracoval aj v tíme Alexa. Aplikáciu si predstavoval ako krok k inteligentným obojkom. Tieto obojky by prekladali zvuky mačiek do ľudskej reči, pričom by vychádzali z komplexných stratégií strojového učenia, ktoré by pomohli ľuďom lepšie pochopiť a starať sa o svoje mačky.
Tím MeowTalk kompenzoval problémy s jedinečnosťou vytvorením konkrétnejších profilov pre každú mačku. V aplikácii registrujete každú mačku zvlášť. Science Norway hlási, že mačiatka mňaukajú inak ako dospelé mačky, takže aplikácia žiada aj o narodeniny mačky. Každý profil generuje pre mačku jedinečnú dátovú sieť, ktorá do strojového učenia začleňuje trochu hlbokého učenia.
Súvisiace: Deep Learning vs. Strojové učenie vs. AI: Ako spolu ladia?
Pre slovnú zásobu začína MeowTalk vo svojej množine údajov s 10 zvukovými profilmi. Každý z nich má pripojený iný význam, napríklad „šťastný“ alebo „lov“. Keď aplikácia počuje zvuk a pokazí ho, môžete ho opraviť alebo vytvoriť novú interpretáciu.
Oprava hovorí aplikácii, aby nahradila základnú slovnú zásobu novým zvukom.
Môžete napríklad povedať aplikácii, aby namiesto dlhého yowla priradila slovo „Lov“ ku krátkym cvrlikáním. Tento druh korekcie je užitočnejší ako pridanie viacerých zvukov, ktoré sa zhodujú s jedným, čo znamená spôsob rozpoznávania reči laň, čo by bolo ako povedať aplikácii, že dlhé yowl a krátke cvrlikanie oboje znamená „Matka volanie“.
Strojové učenie v aplikáciách na rozpoznávanie reči zvyčajne odoláva tomuto typu prepisovania. Bolo by to ako pokúsiť sa naučiť Siriho, že keď poviete „technologický blog“, máte na mysli skutočne „hrušku“. Ale flexibilnejšia forma strojového učenia, ktorú používa MeowTalk, dokáže túto opravu zvládnuť viac ľahko.
Vytvorenie novej interpretácie pridáva význam, ktorý nebol predtým zakódovaný. Napríklad, ak má vaša mačka konkrétny hovor, keď chce svoju obľúbenú hračku, môžete ako voľbu pridať „Chcem svoju myš“. Je to podobné ako keď pridáte slovo do svojho slovníka automatických opráv.
Súvisiace: Ako definovať svoje vlastné slová automatických opráv v systéme Android
Postupom času si môžete pre svoju mačku vytvoriť vysoko prispôsobený rečový profil. Nakoniec by to mohlo byť dokonca také sofistikované, aby to bolo užitočné pri sedení s domácimi miláčikmi alebo pri riešení problémov so správaním. Ak už nič iné, pomáha majiteľom mačiek venovať pozornosť svojim miláčikom.
Verdikt: Fungujú aplikácie na preklady mačiek?
Nakoniec sa „preklad mačiek“ stále veľmi spolieha na to, že používateľ naučí aplikáciu, ako jeho mačka hovorí. Pravdepodobne to tak bude vždy kvôli tomu, aká jedinečná je komunikácia každej mačky.
Ale skutočnosť, že strojové učenie prišlo tak ďaleko, že vývojári v tom môžu čo i len čiastočne uspieť, je neuveriteľná. Strojové učenie a AI napredujú závratnou rýchlosťou a my sa už nemôžeme dočkať, kam ďalej.
- Vysvetlená technológia
- Učenie jazyka
- Strojové učenie
Natalie Stewart je spisovateľka pre MakeUseOf. Najskôr sa začala zaujímať o technológie na vysokej škole a na univerzite si vybudovala vášeň pre písanie médií. Natalie sa zameriava na technológie, ktoré sú prístupné a ľahko použiteľné, a miluje aplikácie a zariadenia, ktoré uľahčujú život bežným ľuďom.
Prihlásiť sa ku odberu noviniek
Pripojte sa k nášmu bulletinu s technickými tipmi, recenziami, bezplatnými elektronickými knihami a exkluzívnymi ponukami!
Ešte jeden krok…!
V e-maile, ktorý sme vám práve poslali, potvrďte svoju e-mailovú adresu.