YOLO-NAS je vrcholom modelov detekcie objektov v sérii YOLO. Prečo sa však považuje za najlepší?

Po YOLOv8 je tu ešte nový a lepší, najmodernejší model detekcie objektov, YOLO-NAS. Ide o algoritmus detekcie objektov vyvinutý spoločnosťou Deci AI, aby sa vyrovnal s obmedzeniami predchádzajúcich modelov YOLO (You Only Look Once).

Model je vytvorený z AutoNAC, vyhľadávacieho nástroja Neural Architecture. Prevyšuje rýchlosť a výkon modelov SOTA, čo predstavuje veľký skok v detekcii objektov zlepšením kompromisov medzi presnosťou a latenciou a podporou kvantizácie.

Tento článok bude diskutovať o silných stránkach a vlastnostiach YOLO-NAS a skúmať, prečo je to najlepší model detekcie objektov v sérii YOLO.

Pochopenie toho, ako YOLO-NAS funguje

Deci's AutoNAC (Automated Neural Architecture Construction) generuje architektúru YOLO-NAS. AutoNAC je bezproblémový proces, ktorý poskytuje zvýšenie výkonu existujúcich hlbokých neurónových sietí.

Potrubie AutoNAC berie používateľom trénovanú hlbokú neurónovú sieť ako vstup, súbor údajov a prístup k inferenčnému systému. Používateľom vyškolená hlboká neurónová sieť potom prechádza prepracovaním pomocou potrubia. Potom sa dosiahne optimalizovaná architektúra s nižšou latenciou bez zníženia presnosti.

instagram viewer

YOLO-NAS používa RepVGG. RepVGG ho sprístupňuje na optimalizáciu po tréningu pomocou reparametrizácie alebo kvantizácie po tréningu. Ide o typ architektúry neurónovej siete založenej na VGG. Používa techniky regularizácie navrhnuté na zlepšenie zovšeobecnenia modelov hlbokého učenia.

Dizajn architektúry je efektívnejší z hľadiska rýchlosti a pamäte. RepVGG absolvuje školenie s použitím viacvetvovej architektúry, aby sa dosiahla rýchlejšia inferencia. Potom sa pomocou reparametrizácie prevedie na jednu vetvu.

Táto funkcia robí YOLO-NAS veľmi užitočným pre produkčné nasadenie. Je to preto, že je možné trénovať a optimalizovať model s úplnou presnosťou na rýchlosť odvodzovania a využitie pamäte.

Kľúčové vlastnosti YOLO-NAS

Medzi kľúčové vlastnosti YOLO-NAS patria:

  • Kvantovanie-Aware tréning: Model využíva QSP a QCI (moduly s ohľadom na kvantizáciu) na zníženie straty presnosti počas kvantizácie po trénovaní kombináciou reparametrizácie 8-bitovej kvantizácie.
  • Automatický návrh architektúry: AutoNAC, patentovaná technológia NAS spoločnosti Deci, hľadá optimálnu modelovú architektúru, ktorá integruje základné architektúry modelov YOLO, aby vytvorila optimalizovaný model.
  • Hybridná kvantizačná technika: Štandardná kvantizačná metóda ovplyvňuje celý model. Na rozdiel od toho hybridná kvantizačná technika kvantuje časť modelu, aby sa vyrovnala latencia a presnosť modelu.
  • Použite jedinečné prístupy na prípravu modelu na tréning pomocou automaticky označených údajov. Model sa potom učí zo svojich predpovedí a pristupuje k veľkému množstvu údajov.

Porovnávacia analýza: YOLO-NAS verzus iné modely YOLO

Nižšie je uvedené porovnanie rôznych modelov série YOLO.

YOLO-NAS je lepší ako už existujúce modely detekcie objektov, ale má aj svoje nevýhody. Tu je zoznam výhod a nevýhod YOLO-NAS:

Pros

  • Je to open source.
  • Je o 10-20% rýchlejší ako predchádzajúce modely YOLO.
  • Je presnejší v porovnaní s už existujúcimi modelmi YOLO.
  • Používa lepšiu architektúru AutoNAC. Toto predstavuje nový rekord v detekcii objektov a poskytuje najlepšiu presnosť a výkonnosť pri kompromise latencie.
  • Bezproblémová podpora pre inferenčné nástroje, ako je NVIDIA. Táto funkcia z neho robí model pripravený na výrobu.
  • Má lepšiu efektívnosť pamäte a vyššiu rýchlosť odvodzovania.

Zápory

  • Zatiaľ nie je stabilná, pretože technológia je stále nová a vo výrobe sa vo veľkom nepoužíva.

Implementácia YOLO-NAS

Budete používať Google Colab písať a spúšťať kódy v tejto implementácii. Alternatívou pre Google Colab by bolo vytvoriť virtuálne prostredie a použite IDE na vašom lokálnom počítači.

Model je veľmi náročný na zdroje. Pred spustením na vašom počítači sa uistite, že máte aspoň 8 GB RAM. Čím väčšia je veľkosť videa, tým viac pamäte využíva.

Inštalácia závislostí

Nainštalujte závislosť YOLO-NAS, super-gradienty pomocou príkazu nižšie:

pip install super-gradienty==3.1.2

Po úspešnej inštalácii teraz budete môcť trénovať model YOLO-NAS.

Modelový tréning

Ak chcete trénovať model, spustite blok kódu nižšie:

od super_gradients.tréning importovať modelov
yolo_nas_l = models.get("yolo_nas_l", predtrénované_váhy="coco")

V tomto kóde importujete tréningový model z nainštalovanej knižnice SuperGradients. Potom používate vopred natrénované modelové závažia zo súboru údajov COCO.

Modelová inferencia

Vyvodenie modelu má potenciálne aplikácie pre úlohy detekcie obrazu, klasifikácie a segmentácie.

V tomto prípade sa zameriate na úloha detekcie objektov pre videá a obrázky. Ak chcete zistiť objekt na obrázku, spustite blok kódu nižšie:

url = "img_path"
yolo_nas_l.predict (url, conf=0.25).šou()

Uistite sa, že používate presnú cestu k obrázku. V tomto prípade nahrajte obrázok do prostredia Google Colab a potom skopírujte cestu k obrázku.

Očakávaný výstup:

Ak chcete zistiť objekty vo videu, spustite blok kódu nižšie:

importovať fakľa

input_video_path = "cesta_k_videu"
output_video_path = "detected.mp4"
zariadenie = 'cuda'ak torch.cuda.is_available() inak"CPU"
yolo_nas_l.to (zariadenie).predpovedať (cesta_vstupného_videa).uložiť (cesta_výstupného_videa)

Nahrajte video, ktorého objekty chcete rozpoznať, do prostredia Google Colab a skopírujte cestu k premennej videa. Predpokladané video bude prístupné z prostredia Google Colab pomocou názvu zistené.mp4. Pred ukončením relácie si stiahnite video do miestneho počítača.

Očakávaný výstup:

YOLO-NAS tiež podporuje dolaďovanie modelu a školenie na vlastných údajoch. Dokumentácia je dostupná na Deci's doladenie štartovacieho notebooku.

Aplikácie YOLO-NAS v reálnom svete

Zdrojový kód YOLO-NAS je prístupný pod licenciou Apache 2.0, ktorá je prístupná na nekomerčné použitie. Pre komerčné využitie by mal model prejsť od nuly preškolením, aby získal vlastné závažia.

Ide o všestranný model, ktorého uplatnenie je možné v niekoľkých oblastiach, ako napr.

Autonómne vozidlá a robotika

YOLO-NAS dokáže zlepšiť vnímacie schopnosti autonómnych vozidiel, čo im umožní rýchlejšie a presnejšie detekovať a sledovať objekty v reálnom čase. Táto schopnosť pomáha zaistiť bezpečnosť na cestách a plynulý zážitok z jazdy.

Dohľadové a bezpečnostné systémy

Model môže poskytnúť rýchlu, presnú detekciu objektov v reálnom čase pre dohľad a bezpečnosť systémov, čo pomáha identifikovať potenciálne hrozby alebo podozrivé aktivity, čo vedie k lepšej bezpečnosti systémov

Maloobchod a riadenie zásob

Model môže poskytnúť rýchle a presné možnosti detekcie objektov, ktoré umožňujú efektívne a v reálnom čase automatizované riadenie zásob, sledovanie zásob a optimalizáciu regálov. Tento model pomáha znižovať prevádzkové náklady a zvyšovať zisky.

Zdravotníctvo a lekárske zobrazovanie

V zdravotníctve je YOLO-NAS schopný pomôcť pri efektívnej detekcii a analýze anomálií chorôb alebo špecifických oblastí záujmu. Model môže pomôcť lekárom presne diagnostikovať choroby a monitorovať pacientov, čím sa zlepší sektor zdravotníctva.

YOLO-NAS Takeaway

YOLO-NAS je nový model detekcie objektov, ktorý je priekopníkom nového spôsobu vykonávania detekcie objektov. Je to lepšie ako modely SOTA. Jeho výkon pri detekcii objektov je veľkým skokom pre projekty počítačového videnia.