Google vydal svoj zdrojový kód beta zvukového kodeku Lyra na GitHub, čím sprístupnil spracovanie zvuku v neuveriteľnej kvalite s nízkou bitovou rýchlosťou všetkým vývojárom. Kodek je najužitočnejší v situáciách s obmedzenou šírkou pásma, kde je potrebné uložiť čo najviac údajov.
Lyra: Takmer nič nikdy neznelo tak dobre
Zvukový kodek pracuje na princípe poskytovania čo najprirodzenejšej reči s najnižšou možnou dátovou rýchlosťou. Darí sa mu vytvárať takmer tajuplné úrovne reprodukcie zvuku s prenosovými rýchlosťami až 3 kb / s. Google používa kompresiu Lyra v reálnom čase už vo svojej aplikácii Duo, hoci by vám nebolo možné vyčítať, že ste si ani neuvedomili rozdiel oproti bežnému zvuku v šírke pásma.
Na demonštráciu toho, o koľko je Lyra lepšia ako iné kodeky, poskytuje Google príklady prostredníctvom a príspevok v blogu porovnanie kompresného kodeku poháňaného strojovým učením s inými alternatívami 3 a 6 kb / s.
Je to rozdiel medzi dňom a nohami a poskytnutie vývojárov týmto nástrojom po celom svete bude významnou hybnou silou pri zlepšovaní kvality komunikácie v prípade obmedzenej šírky pásma. Je to tiež vynikajúci motivátor pre vývojárov, ktorí sa snažia vytvárať nové aplikácie na rozvíjajúcich sa trhoch, čo Google tento rok určite pokryje
bezplatná virtuálna konferencia Google I / O online.Zdrojový kód beta je v súčasnosti navrhnutý so zreteľom na 64-bitové zariadenia Arm, príklady však budú fungovať aj na 64-bitových systémoch x86 Linux. Zdrojový kód je poskytnutý úplne zdokumentovaný, aj keď je v beta verzii, a stránka GitHub poskytuje pokyny na inštaláciu a spôsob zostavenia Lyra v systéme Linux pre 64-bitové ciele Arm.
Ak chcete získať zdrojový kód beta verzie Lyra, prejdite na stránku Stránka Lyra GitHub.
Ako účinkuje Lyra?
Samotný proces, ktorý Lyra používa, je neuveriteľne zložitá kombinácia vycvičených modelov strojového učenia tisíce hodín rečových dát a optimalizácia existujúcej technológie zvukových kodekov, teória je dosť jednoduché.
Každých 40 ms sú funkcie prevzaté z reči a komprimované na rýchlosť 3 kb / s. Tieto funkcie predstavujú body energie reči naprieč frekvenčným spektrom najbližšie k ľudskej sluchovej reči - veci, ktoré musíme rozpoznať a porozumieť im, keď niekto hovorí.
Kľúčovou časťou toho, čo robí Lyru špeciálnou, je to, ako používa tieto informácie:
Avšak tradičné parametrické kodeky, ktoré jednoducho extrahujú z reči kritické parametre, ktoré potom môžu byť slúži na opätovné vytvorenie signálu na prijímacom konci, na dosiahnutie nízkych bitových tokov, ale často znie roboticky a neprirodzene. Tieto nedostatky viedli k vývoju novej generácie vysoko kvalitných generátorov zvuku, ktoré majú priniesol revolúciu v poli tým, že dokázal nielen rozlišovať medzi signálmi, ale aj generovať úplne nové tie.
Po prenose Lyra znovu vytvorí tvar vlny vyplnením toho, čo tomuto procesu chýba, pričom nie je nijako výpočtovo zložitá.
Na jednej strane je to technologický zázrak, ktorý pobeží takmer kdekoľvek. Na druhej strane stále nie som stopercentne presvedčený, že to nie je čarodejníctvo.
Google Duo je jednou z najlepších aplikácií pre videohovory. Má veľa funkcií a tu si myslíme, že by ste ich mali skutočne používať.
Prečítajte si Ďalej
- Tech News
- Android
- Strojové učenie
Ian Buckley je nezávislý novinár, hudobník, performer a producent videa žijúci v Berlíne v Nemecku. Keď nepíše alebo na pódiu, hrá s elektronikou alebo kódom pre domácich majstrov v nádeji, že sa z neho stane šialený vedec.
Prihlásiť sa ku odberu noviniek
Pripojte sa k nášmu bulletinu s technickými tipmi, recenziami, bezplatnými elektronickými knihami a exkluzívnymi ponukami!
Ešte jeden krok…!
V e-maile, ktorý sme vám práve poslali, potvrďte svoju e-mailovú adresu.