Zamysleli ste sa niekedy nad tým, ako Shazam „počuje“ hudbu, ktorú hráte, a identifikuje ju s takou presnosťou? Nie si sám.

Technológia napájajúca službu rozpoznávania hudby je pre mnohých záhadou, najmä od doby, kedy bola služba spustená roky predtým, ako sa z chytrých telefónov a strojového učenia stala vec.

V tomto článku sa pozrieme na to, ako Shazam funguje a ako dokáže presne rozpoznať hudbu.

Čo je Shazam?

Shazam je populárna aplikácia na rozpoznávanie hudby, pomocou ktorej môžete vyhľadať informácie o novej skladbe, ktorú máte radi, ale nepoznáte jej názov alebo meno.

Povedzme, že ste v kaviarni alebo sa prechádzate po rohu obchodu, a začujete novú skladbu, ktorú by ste chceli mať vo svojej hudobnej knižnici. Shazam vám pomôže ľahko nájsť pieseň. Všetko, čo musíte urobiť, je nahrať niekoľko sekúnd skladby do aplikácie.

Aplikácia Shazam využíva sofistikovanú technológiu rozpoznávania zvuku na identifikáciu hudby, ktorú počujete sekúnd, aby ste mohli zistiť meno umelca a sledovať, sledovať videá, alebo dokonca kúpiť alebo streamovať skladbu vo vašom zariadenie.

instagram viewer

Stiahnuť ▼: Shazam pre iOS |Android (Zadarmo)

Ako funguje Shazam?

Galéria obrázkov (4 obrázky)
Rozbaliť
Rozbaliť
Rozbaliť
Rozbaliť

Obrázok 1 zo 4

Obrázok 2 zo 4

Obrázok 3 zo 4

Obrázok 4 zo 4

Shazam používa na identifikáciu zhôd skladieb dopytovaných na svojej platforme patentovanú technológiu vyvinutú Avery Lin-Chun Wangom, spoluzakladateľom a hlavným dátovým vedcom aplikácie. Táto technológia vytvára odtlačky prstov pre zvukové nahrávky, čo je tajná omáčka za Shazamovými úžasnými schopnosťami rozpoznávania.

Shazam vytvára a ukladá zvukové odtlačky prstov pozostávajúce zo zbierok číselných údajov pre každú viac ako 15 miliárd skladieb. Keď používateľ „shazamuje“ skladbu, Shazam rýchlo vytvorí zvukový odtlačok zvuku prijatého zo smartphonu alebo mikrofónu počítača.

Po dokončení vytvárania zvukového odtlačku prsta pre nahrávku nahrá Shazam zvukový odtlačok prsta (nie zvukový) na svoj server, kde spustí vyhľadávanie databáz v zhodách. Ak sa nájde zhoda, vráti informácie o skladbe spolu s možnosťami, kam ju streamovať alebo kúpiť, spolu s identifikačnými údajmi.

Čo je to zvukový odtlačok prsta?

Zvukový odtlačok prsta je zhustený digitálny súhrn zvukových signálov. Používajú sa na identifikáciu zvukovej vzorky alebo na vyhľadanie podobných položiek v zvukovej databáze.

Technológia odtlačkov prstov spoločnosti Shazam dokáže priradiť neoznačené kúsky zvukového obsahu k zodpovedajúcim zhodám v jej zvukovej databáze. Shazam identifikuje názov piesne, ktorú ste nahrali (zvukový obsah bez označenia) podľa zhody odtlačku prsta piesne s odtlačkom piesne v jej databáze.

Shazam vytvára jedinečné odtlačky prstov pre skladby vo svojej databáze pomocou určitých údajových bodov identifikovaných pomocou spektrogramu.

Čo je spektrogram?

Spektrogram je trojrozmerný graf používaný ako reprezentácia zvuku. Spektrogram ukazuje zmenu frekvencií za určité obdobie, pričom zohľadňuje aj amplitúdu alebo objem. Na fotografii nižšie je príklad čítania spektrogramu.

Uznávaný obrázok: Akcia na ochranu pobrežia Changhua /https://search.creativecommons.org/photos/e6b0b0f3-79ea-4621-9029-1b73365a52ac

V rozhovore z roku 2003 s Scientific AmericanAvery Wang odhalil, že Shazamov algoritmus využíva na generovanie zvukových odtlačkov prstov spektrogramové body predstavujúce noty s najvyššou energiou.

Ak ignoruje väčšinu informácií v skladbe a zameriava sa iba na niekoľko definujúcich poznámok, môže Shazam prehľadávať svoju databázu a poskytovať neuveriteľnou rýchlosťou presné zhody s požiadavkami na piesne.

Ako je Shazam schopný identifikovať piesne na hlučných miestach?

Shazam používa nahrávky skladieb bez šumu a skreslenia pozadia na vytváranie odtlačkov prstov pre svoju databázu. Keď s aplikáciou nahráte skladbu na hlučnom mieste, vytvorí sa zvukový odtlačok vašej nahrávky identifikáciou nôt s najvyššou energiou v nahrávke.

Potom vyhľadá vo svojej databáze zhodu pre zvukové odtlačky prstov vašej nahrávky, ak to tak je úroveň šumu v pozadí nebola dostatočne vysoká na to, aby skreslila údaje použité na vytvorenie zvuku odtlačok prsta.

Časy, keď vám Shazam nemôže pomôcť identifikovať pieseň

Shazam je vynikajúci v porovnávaní skladieb, dokonca aj nejasnej hudby, o ktorej si myslíte, že ju nemusí mať v databáze. Existujú však chvíle, keď Shazam nedokáže identifikovať stopu?

Skreslený záznam

Keď shazamujete skladbu na mieste, kde je príliš vysoká úroveň šumu v pozadí, šum skreslí údaje spektrálneho programu. Z tohto dôvodu sa zvukový odtlačok vašej nahrávky bude líšiť od pôvodnej skladby.

Keď sa to stane, Shazam vráti Pieseň nie je známa dialóg, pretože nenájde zhodu pre zvukový odtlačok prsta.

Živá hudba

Shazam zaostáva za schopnosťou identifikovať hudbu podľa živých vystúpení. Je to tak preto, lebo zvuk, ktorý nahrávate na živých vystúpeniach, sa často líši od pôvodnej verzie piesne, ktorú Shazam používa na vytváranie zvukových odtlačkov prstov.

Jediný spôsob, ako Shazam dokáže identifikovať skladbu počas živého vystúpenia, je, ak je skupina dostatočne zručná na to, aby skladbu predviedla presne tak, ako bola zaznamenaná. Veľa šťastia pri pokuse kapely o to...

Váš hlasový záznam

"Mohol by som dosiahnuť, aby Shazam rozpoznal pieseň, ktorú som spieval, keby som bol naozaj dobrý spevák?"

Skrátka nie.

Algoritmus Shazam dokáže identifikovať iba vopred zaznamenanú hudbu. Aby Shazam identifikoval pieseň, ktorú spievate, musíte mať rovnaké vokály inštrumentálov v presnom tempe, ako majú pôvodná nahrávka piesne.

Vaše hučanie

Shazam nedokáže identifikovať zhody pre hučanie, pretože jeho algoritmus využíva presné frekvencie a amplitúdy na vytváranie zvukových odtlačkov prstov pre skladby v databáze.

Keď hučíte pieseň, Shazam k nej vytvorí odtlačok prsta. Ale pretože hučanie je iba pokusom o resyntézu skladby, algoritmus sa nebude zhodovať s nahrávkou.

Je Shazam jedinou aplikáciou na identifikáciu hudby?

Shazam bola prvá služba identifikácie hudby a v súčasnosti je najbežnejšie používaná aplikácia na identifikáciu skladieb. Existujú však ďalšie aplikácie, ktoré môžete použiť na identifikáciu skladby hrať sa okolo teba. Niektorí dokonca dokážu identifikovať pieseň, ktorú spievate alebo hučíte.

Tri z najpopulárnejších alternatív Shazamu sú SoundHound, Musixmatch Lyrics a Genius. Musixmatch a Genius vám predovšetkým pomôžu identifikovať texty pre hudbu, ktorá hrá okolo vás, zatiaľ čo SoundHound je najbližším konkurentom spoločnosti Shazam.

Súvisiace: Najlepšie aplikácie na rozpoznávanie hudby na vyhľadanie skladieb podľa ich naladenia

Pomocou aplikácie SoundHound môžete robiť takmer všetko, čo robí Shazam. Jeho hlavnou výhodou oproti Shazamu je, že má pridanú funkcionalitu identifikácie skladieb, ktoré spievate alebo hrkete.

Obrázok: Sulastri Sulastri / Shutterstock.com

Email
Ako identifikovať hudbu a piesne vo videách YouTube

Zaujíma vás, ako identifikovať skladbu z videa YouTube? Tu je návod na hľadanie skladieb YouTube, pomocou ktorého môžete identifikovať hudbu z videí.

Prečítajte si Ďalej

Súvisiace témy
  • Vysvetlená technológia
  • Shazam
  • Music Discovery
  • Zvučný hlučný
  • Musixmatch
O autorovi
John Awa-abuon (Publikovaných 6 článkov)

John je od narodenia milovníkom techniky, trénovaním tvorcu digitálneho obsahu a profesiou Writer Tech Lifestyle. John verí v pomoc ľuďom pri riešení problémov a píše články, ktoré práve toto umožňujú.

Viac od Johna Awa-abuona

Prihlásiť sa ku odberu noviniek

Pripojte sa k nášmu bulletinu s technickými tipmi, recenziami, bezplatnými elektronickými knihami a exkluzívnymi ponukami!

Ešte jeden krok…!

V e-maile, ktorý sme vám práve poslali, potvrďte svoju e-mailovú adresu.

.