Keď sa človek pozrie na scénu alebo obrázok, pochopí to - aké objekty sa v ňom nachádzajú a čo sa deje, ak dôjde k akcii. Počítač na druhej strane spracúva iba digitálne údaje, ktoré popisujú farebnú hodnotu každého pixelu. Pre človeka je rozpoznanie pizze na neprehľadnom stole ľahké. Až donedávna však počítače nedokázali vykonávať rovnakú úlohu.

Počítačové videnie (CV) umožňuje počítaču získavať dôležité informácie z vizuálnych vstupov a na základe týchto informácií robiť presné predpovede a odporúčania.

Ako funguje počítačové videnie?

Pred počítačovým videním, aby človek vytvoril program, ktorý rozpoznal konkrétny obraz, musel robiť hodiny ručnej práce s nohami. Najskôr by sa musela zhromaždiť databáza podobných obrázkov.

Potom by tieto obrázky museli byť manuálne analyzované, merané a anotované príslušnými údajmi že si výskumník myslel, že dokáže identifikovať predmetný objekt (ako je farba, miery a tvar). Až potom sa dal na predpovede použiť softvér.

Na druhej strane počítačové videnie automatizuje celý tento proces pomocou prístupu strojového učenia známeho ako hlboké učenie.

instagram viewer
Hlboké učenie využíva viacvrstvovú neurónovú sieť so stovkami potenciálnych vrstiev. V prípade obrázkov to je zvyčajne konvolučná neurónová sieť (CNN).

Detailné vysvetlenie toho, ako funguje hlboké učenie a neurónové siete, presahuje rámec tohto článku. V zásade sa do neurónovej siete privádza veľké množstvo údajov. Neurónová sieť dáta opakovane analyzuje, až kým o nich nedokáže vytvoriť presné predpovede.

V prípade CNN používaného na úlohu počítačového videnia neurónová sieť prevedie dáta niekoľkými krokmi. Najskôr obrázok zbalí na niekoľko častí (jednotlivé pixely alebo skupiny pixelov, ktoré sú vopred označené).

Potom predpovedá, čo sa nachádza v rôznych častiach obrázka (napríklad tvrdé hrany alebo konkrétne objekty). Opakovane kontroluje presnosť týchto predpovedí a zakaždým mierne mení časti algoritmu, až kým sa nestane veľmi presným.

Počítače sú teraz také výkonné, že dokážu analyzovať obraz oveľa rýchlejšie ako ľudský mozog, najmä keď sa naučia rozpoznávať určité vzorce. Týmto spôsobom je ľahké pochopiť, ako by algoritmus hlbokého učenia mohol predstihnúť ľudské schopnosti.

Aké sú typy počítačového videnia?

Počítačové videnie zahŕňa analýzu a porozumenie obrazov a výstup relevantných predpovedí alebo rozhodnutí o obrázkoch. Počítačové videnie použije na dosiahnutie týchto cieľov rôzne úlohy. Niektoré z nich zahŕňajú:

  • Klasifikácia obrázkov: Typ obrázku je rozpoznaný. Napríklad či už ide o tvár, krajinu alebo objekt človeka. Tento druh úlohy možno použiť na rýchlu identifikáciu a klasifikáciu obrázkov. Jedným z použití je automatické rozpoznávanie a blokovanie nevhodného obsahu na sociálnych sieťach.
  • Rozpoznávanie objektov: Podobne ako pri klasifikácii obrázkov, aj rozpoznávanie objektov dokáže identifikovať konkrétny objekt v scéne - napríklad pizzu na preplnenom stole.
  • Detekcia hrany: Bežné použitie počítačového videnia a zvyčajne prvý krok v detekcii objektov je identifikácia tvrdých hrán v obraze.
  • Identifikácia objektu: Jedná sa o rozpoznávanie jednotlivých príkladov objektu alebo obrazu, napríklad identifikácie konkrétnej osoby, odtlačkov prstov alebo vozidla.
  • Detekcia objektu: Detekcia je identifikácia konkrétnej vlastnosti v obraze, ako je zlomenina kosti na röntgenovom snímku.
  • Segmentácia objektov: Toto je identifikácia toho, ktoré pixely na obrázku patria k predmetnému objektu.
  • Sledovanie objektov: Vo videosekvencii je možné objekt po rozpoznaní ľahko sledovať v celom videu.
  • Obnova obrázka: Rozmazanie, šum a ďalšie artefakty obrazu je možné odstrániť presnou identifikáciou miesta, kde sa objekt v porovnaní s pozadím nachádza.

Príklady počítačového videnia

Umelá inteligencia je sa už používa vo viacerých priemyselných odvetviach s ohromujúcim efektom, čo platí pre počítačové videnie. Tu uvádzam niekoľko príkladov životopisu, ktoré sa už dnes používajú.

Rozpoznávanie tváre

Rozpoznávanie tváre je jedným z hlavných spôsobov, ako sa dnes používa počítačové videnie. V porovnaní s databázami známych tvárí dokážu algoritmy počítačového videnia veľmi presne identifikovať jednotlivých ľudí.

  • Sociálne médiá analyzujú obrázky a automaticky označujú používateľov, pre ktoré má dobrý výber obrázkov.
  • Notebooky, telefóny a zabezpečovacie zariadenia dokážu identifikovať ľudí, ktorí im umožnia prístup.
  • Orgány činné v trestnom konaní používajú na identifikáciu podozrivých osôb rozpoznávanie tváre v kamerových systémoch.

Medicína

Počítačové videnie sa v súčasnosti používa v zdravotníctve na zabezpečenie rýchlejšej a presnejšej diagnózy, ako môžu odborníci urobiť. Mnoho aplikácií zahŕňa analýzu röntgenových snímok, CT alebo MRI snímok pre konkrétne stavy, vrátane neurologických chorôb, nádorov a zlomených alebo zlomených kostí.

Samoriadiace autá

Autonómne vozidlá musia rozumieť svojmu okoliu jazdiť bezpečne. To znamená rozpoznávať cesty, jazdné pruhy, dopravné signály, iné vozidlá, chodcov a ďalšie. Všetky tieto úlohy využívajú systémy počítačového videnia v reálnom čase, aby sa zabránilo kolíziám a jazdila bezpečne.

Počítačové videnie je náročné

Súčasné aplikácie počítačového videnia sa už začínajú posúvať smerom, akým pracujeme v rôznych priemyselných odvetviach. Počítačové videnie má schopnosť vylepšovať systémy a zachraňovať životy, počnúc schopnosťou zistiť chybné alebo pokazené zariadenie až po presnú diagnostiku rakoviny.

Nie je to však bez jeho výziev. Počítačové videnie má stále ďaleko od toho, čo je ľudské. Máme tisíce rokov evolúcie, ktorá nám umožňuje rozpoznávať a chápať takmer všetko, čo sa okolo nás deje, v reálnom čase. Ale netušíme, ako tieto úlohy plní ľudský mozog.

Hlboké učenie je obrovský krok správnym smerom, ale stále si vyžaduje úžasné množstvo práce vytvoriť systém, ktorý dokáže vykonávať úlohy, ktoré ľudia môžu robiť veľmi ľahko, napríklad identifikovať auto na vozidle cesta. Je to tak preto, lebo počítače vykonávajú obmedzené úlohy veľmi efektívne. Vývoj počítača, ktorý dokáže pochopiť celkovú zložitosť vizuálneho sveta, je úplne iná loptová hra.

Keď bude prebiehať ďalší výskum v oblasti aplikácií AI a ľudskej biológie, je pravdepodobné, že v blízkej budúcnosti zaznamenáme explóziu možného využitia počítačového videnia.

Email
Čo sú algoritmy strojového učenia? Takto fungujú

Algoritmy strojového učenia sú navrhnuté tak, aby uľahčovali život a zlepšovali systémy, ale môžu sa zhoršovať a mať zlé následky.

Prečítajte si Ďalej

Súvisiace témy
  • Vysvetlená technológia
  • Programovanie
  • Umela inteligencia
  • Neurálne siete
O autorovi
Jake Harfield (16 publikovaných článkov)

Jake Harfield je nezávislý spisovateľ so sídlom v austrálskom Perthe. Keď nepíše, zvyčajne je vonku v kríkoch a fotografuje miestnu divočinu. Môžete ho navštíviť na www.jakeharfield.com

Viac od Jakea Harfielda

Prihlásiť sa ku odberu noviniek

Pripojte sa k nášmu bulletinu s technickými tipmi, recenziami, bezplatnými elektronickými knihami a exkluzívnymi ponukami!

Ešte jeden krok…!

V e-maile, ktorý sme vám práve poslali, potvrďte svoju e-mailovú adresu.

.