Strojové učenie sa dnes stalo centrom diskusií v oblasti umelej inteligencie. Dotýka sa všetkých oblastí vrátane strojárstva, medicíny, obchodu, sociálnych vied a ďalších.

Vďaka použitiu niekoľkých knižníc strojového učenia, ktoré sú dnes k dispozícii, je strojové učenie okrem iného s jazykmi Python, C ++, Java, Julia a R jednoduchšie než kedykoľvek predtým. Tu je niekoľko populárnych knižníc strojového učenia, s ktorými môžete začať, ak sa chcete vydať na túto sľubnú kariérnu cestu.

1. Keras

Keras je súčasťou rozsiahlych nástrojov strojového učenia spoločnosti TensorFlow. Je však odlišný v tom, že je to API vyššej úrovne, ktoré sa dodáva s TensorFlow. Navyše je priateľskejší k ľuďom a je písaný s jazykom Python. Je teda implementovateľnejší, pretože ponúka stručnú dokumentáciu, ktorú si ľahko zúži začiatočník strojového učenia.

Keras však ponúka širokú škálu funkcií strojového učenia, ktoré sú ideálne na školenie štruktúrovaných dát aj surových médií. Knižnica však pokrýva textové a obrazové algoritmy na školenie a testovanie vašej množiny údajov.

instagram viewer

Jedinečnou vlastnosťou systému Keras je, že vás zameriava na knižnicu, pretože poskytuje všetko, čo potrebujete pre svoj projekt, v jednom kuse. Sotva sa budete musieť rozdeľovať, aby ste si požičali nástroje od iných knižníc. Ladenie hyperparametrov, výber funkcií, bohaté vrstvy predbežného spracovania údajov a čistenie údajov patria medzi jeho veľkolepé vstavané funkcie.

S KERAS môžete čítať obrázky a texty priamo z rozdelených priečinkov v nadradenom adresári a získať z nich označený súbor údajov. A ak sú vaše údaje veľké a nesedia vám v pamäti počítača, Keras ponúka možnosť vysoko výkonného objektu množiny údajov. Na to sa dá vždy prepnúť.

Súvisiace: Ako aktualizujte svoje schopnosti v oblasti Pythonu a AI pomocou knižníc strojového učenia Python

Okrem toho ponúka rôzne jednotky grafického spracovania (GPU) na spracovanie veľkého súboru údajov. Umožňuje vám teda súčasne asynchrónne vykonávať výpočty CPU a spracovanie GPU.

2. TensorFlow

Predstavený spoločnosťou Google v roku 2015, TensorFlow je viac rámcom ako knižnicou. Je to open-source knižnica postavená na jazyku C ++ a funguje na základe sledovania grafov toku údajov.

TensorFlow je veľmi univerzálny a rozsiahly a ponúka množstvo ďalších vstavaných, unitárnych knižníc na vykonávanie výpočtov strojového učenia. TensorFlow v zásade ponúka škálovateľnú platformu na vytváranie konceptov strojového učenia, ako sú umelé neurónové siete (ANN), hlboké neurónové siete a hlboké vzdelávanie.

Súvisiace: Čo je TensorFlow Lite a ako je rámec pre hlboké vzdelávanie?

Tensorflow okrem Pythonu okrem iného podporuje aj jazyky Java, C ++, Julia, Rust, Ruby a JavaScript. Aj keď používanie TensorFlow v programovacích jazykoch iných ako Python môže ponúkať jednoduchú integráciu projektu, používanie jeho jadier v jazyku Python je jednoduchšie, pretože plne podporuje implementáciu TensorFlow.

Okrem toho môžu vývojové kanály v iných jazykoch predstavovať problémy s kompatibilitou verzií API, ak potrebujete verzie prepnúť neskôr. Napriek tomu, že dokumenty TensorFlow sú komplexné, na rozdiel od Kerasu môžu byť príliš rôznorodé na to, aby ich začiatočníci pochopili. To znamená, že má solídnu podporu komunity a nájdete ich tiež veľa open-source príklady TensorFlow tam vonku.

Výhodou TensorFlow oproti Keras je, že TensorFlow môžete používať priamo bez Keras. To isté samozrejme nemôžete povedať pre Keras, pretože je to rozvetvená trieda samotného TensorFlow.

3. Mlib Spark

Tu je niečo celkom praktické od Apache Spark. Vydaný a otvorený open source v roku 2010, Mlib Spark používa iteračné výpočty na spustenie algoritmov strojového učenia. Vzhľadom na svoj iteračný charakter môže Mlib využívať Hadoop alebo lokálne zdroje údajov a pracovné toky. Navyše je schopný spustiť komplexnú logiku v krátkom čase.

Nakoniec je to stále jedna z najrýchlejších knižníc strojového učenia, ktoré existujú. Prevádzkuje širokú škálu algoritmov strojového učenia vrátane regresných, klastrovacích, klasifikačných a odporúčacích modelov. Vyniká aj z hľadiska predbežného spracovania dát a dolovania vzorov.

Súvisiace: Čo sú algoritmy strojového učenia? Tu je návod, ako fungujú

Knižnica je dynamická a ponúka robustné rozhranie API, ktoré sa pripája k programom Scala, Python, R a Java. Mlib Spark je vstavbou samotného Sparku, takže sa aktualizuje s každým vydaním Sparku.

Mlib Spark má vysvetľujúcu dokumentáciu, takže začiatočník si ho ľahko vezme. Trochu mínus je, že sa integruje iba do niekoľkých programovacích jazykov, takže ak nie ste oboznámení s jazykmi, ktoré v súčasnosti podporuje, môže to byť problém.

4. mlpack

mlpack bol vydaný v roku 2008 a bol vyvinutý v jazyku C ++ pomocou lineárnej algebrovej knižnice s názvom Armadillo. Rovnako ako Mlib Spark vám umožňuje použiť stručné a čitateľné riadky kódu väčšinu dostupných algoritmov a konceptov strojového učenia priamo na váš súbor údajov.

Okrem toho, že je k dispozícii v programovacích jazykoch ako Python, C ++, Go a Julia, podporuje aj spustenie CLI, ktoré vám umožní spustiť kód a prijímať okamžité odpovede. Napriek tomu, že podporuje väzbu s týmito inými jazykmi, spustenie mlpacku na veľkých množinách údajov, ktoré vyžadujú zložité výpočty, nemusí byť dobrý nápad, keď ho použijete v inom programovacom jazyku. Preto je škálovateľnosť s inými jazykmi okrem C ++ často problémom mlpack.

Ak ste začiatočník v strojovom učení a máte znalosti o C ++, stále to môžete vyskúšať. Dokumentácia obsahuje ľahko zrozumiteľné príručky a príklady, ktoré sú k dispozícii pre rôzne programovacie jazyky. Pretože mlpack beží výpočty na koncepte C ++, používa mlpack kód na nízkej úrovni na rýchle vykonávanie zložitých až jednoduchých úloh strojového učenia.

5. Pytorch

Facebook sa vyvinul Pytorch a oficiálne ho vydali v roku 2016. Pytorch je známa svojim rozsiahlym využitím v počítačovom videní, hlbokom vzdelávaní a spracovaní prirodzeného jazyka a je open-source knižnicou postavenou na architektúre Torch.

Rovnako ako Keras a Tensorflow, Pytorch podporuje spracovanie dátových množín procesorom. A ak je váš súbor údajov veľký, je vybavený procesorom GPU, ktorý zvládne vaše výpočty. Navyše je založený na tenzore.

Okrem Pythonu knižnica podporuje väzbu pre C ++ aj Java. Pytorch okrem iných nástrojov ponúka aj doplnkové knižnice vrátane baterka, text pochodne, torchaudioa TorchServe.

Tieto knižnice sú súčasťou funkcií strojového učenia Pytorch a stretnete sa s nimi pri písaní svojich modelov Pytorch. Vďaka podrobnej a komplexnej dokumentácii založenej na tutoriáli je Pytorch ľahko zrozumiteľný, pokiaľ poznáte koncepty strojového učenia.

Pytorch vám tiež umožňuje transformovať vaše súbory údajov do strojovo vhodného formátu. Je to teda tiež perfektná knižnica na predbežné spracovanie údajov. S Pytorchom je vždy možné extrahovať funkcie, čistiť údaje, rozdeľovať údaje a ladiť hyperparametre.

6. Scikit-Learn

Ponorne postavené s Pythonom, scikit-learn, tiež nazývaný sklearn, bol verejne prepustený v roku 2010. Knižnica však ponúka širokú škálu aplikácií strojového učenia vrátane modelovania odporúčaných a nefunkčných súborov údajov.

Scikit-learn ponúka známe dohliadané algoritmy vrátane lineárnych a logistických regresných modelov, podporný vektorový stroj (SVM), Naive Bayes, rozhodovacie stromy, okrem iných aj najbližší susedia, priamo z box. Je to tiež bohatý zdroj učebných metód bez dozoru, ako je klastrovanie, Gaussov model, modely neurónových sietí a ďalšie.

Scikit-learn v zásade podporuje modely pod dohľadom aj bez dozoru. Je to skvelý východiskový bod, ak ste ešte stále nováčikom v Pythone alebo v strojovom učení, pretože je úplne založené na Pythone. A ak práve začínate so strojovým učením alebo s dátovou vedou, možno budete chcieť začať s dohliadanými funkciami scikit-learn.

Celkovo je priateľskejší pre začiatočníkov ako ostatné knižnice v zozname. Na rozdiel od iných knižníc uvedených vyššie, scikit-learn je pri vykonávaní vysokovýkonných matematických výpočtov výrazne závislý od modelov Numpy a Scipy. A taktiež používa Matplotlib na prezentáciu pútavých vizualizácií rozprávajúcich príbehy.

7. Theano

Ak hľadáte knižnicu, ktorá vám pomôže rozdeliť zložité problémy na flexibilné algoritmy, potom Theano môže to byť to, čo chceš. Theano, ktorú v roku 2007 vytvoril Yoshua Bengio v kanadskom Montreale, je výkonnou knižnicou na prevádzkovanie malých až vysokovýkonných výpočtov.

Rovnako ako Scikit-Learn, aj Theano závisí od Numpyho pri vykonávaní numerických výpočtov. Knižnica podporuje výpočty založené na GPU a navyše generuje nízkoúrovňový kód C. To urýchľuje matematické hodnotenia s Theanom, bez ohľadu na to, aké veľké sú. Jeho modely hlbokého učenia navyše fungujú na tenzore.

Pomocou Theano môžete svoju množinu údajov previesť na čitateľné plávajúce, binárne alebo celočíselné body bez ohľadu na pôvodný typ údajov. Možno však nedostanete dostatočnú podporu komunity. Je to preto, že Theano nie je tak populárny ako ostatné knižnice, ktoré sme spomenuli skôr. To neznamená, že nie je o nič menej prívetivý pre začiatočníkov.

Tutoriál v dokumentoch je ľahko zrozumiteľný. Vďaka svojej schopnosti zjednodušovať komplexné polia a optimalizovať nekonečné výpočty je ideálny na vytváranie škálovateľných modelov strojového učenia.

Akú knižnicu by ste mali použiť pre svoj ďalší projekt strojového učenia?

Aj keď sme spomenuli niektoré z najpoužívanejších knižníc strojového učenia, prichádzame s príponou ten najlepší môže byť náročný, pretože všetky slúžia veľmi podobným účelom, iba s niekoľkými rozdielmi Vlastnosti.

Samozrejme, začať s knižnicou vhodnejšou pre začiatočníkov, ako je Scikit-Learn alebo Keras, je užitočné, ak sa práve púšťate do terénu. Okrem toho účelový výber knižnice pre projekt vám pomôže zúžiť zložitosť vývojového kanála. Ale to znamená, že zoznámiť sa so základmi strojového učenia prostredníctvom kurzov a návodov je užitočné.

zdieľamTweetE -mail
Čo sú algoritmy strojového učenia? Tu je návod, ako fungujú

Algoritmy strojového učenia sú navrhnuté tak, aby uľahčovali život a zlepšovali systémy, ale môžu sa pokaziť so zlými dôsledkami.

Čítajte ďalej

Súvisiace témy
  • Programovanie
  • Strojové učenie
  • Programovanie
O autorovi
Idowu Omisola (91 publikovaných článkov)

Idowu je zanietený pre čokoľvek, čo sa týka inteligentných technológií a produktivity. Vo svojom voľnom čase sa hrá s kódovaním a keď sa nudí, prejde na šachovnicu, ale tiež sa rád z času na čas odtrhne od rutiny. Jeho vášeň ukazovať ľuďom cestu okolo moderných technológií ho motivuje písať viac.

Viac od Idowu Omisola

prihlásiť sa ku odberu noviniek

Pripojte sa k nášmu bulletinu a získajte technické tipy, recenzie, bezplatné elektronické knihy a exkluzívne ponuky!

Kliknutím sem sa prihlásite na odber