Článok v nasledujúcom tlačidle: 899988
Notebook Jupyter je nástrojom číslo jeden pre dátových vedcov. Ponúka interaktívne webové rozhranie, ktoré možno použiť na vizualizáciu údajov, ľahkú analýzu a spoluprácu.
Vizualizácia údajov vám umožňuje nájsť kontext pre vaše údaje prostredníctvom máp alebo grafov. Tento výukový program ponúka dôkladného sprievodcu interakciou s grafmi v poznámkovom bloku Jupyter.
Predpoklady
Musíte mať nainštalovaný Jupyter na vašom stroji. Ak nie je, môžete si ho nainštalovať zadaním nasledujúceho kódu do príkazového riadku:
$ pip nainštalovať jupyter
Budete tiež potrebovať pandy a matplotlib knižnica:
$ pip nainštalujte pandy
$ pip nainštalovať matplotlib
Po dokončení inštalácií spustite server Jupyter Notebook. Zadajte do terminálu nasledujúci príkaz. V predvolenom prehľadávači vášho počítača sa otvorí stránka Jupyter so súbormi v aktuálnom adresári.
$ notebook jupyter
Poznámka: Nezatvárajte okno terminálu, v ktorom spustíte tento príkaz. Ak to urobíte, váš server sa zastaví.
Jednoduché sprisahanie
Na novej stránke Jupyter spustite tento kód:
import matplotlib.pyplot ako plt
x = [1,2,3,4,5,6,7,8]
y = [2,4,6,8,10,12,14,16]
plt.plot (x, y)
plt.show ()
Kód slúži na jednoduché vykreslenie čiary. Prvý riadok importuje pyplot grafická knižnica z matplotlib API. Tretí a štvrtý riadok definujú osi x a y.
The zápletka () sa volá metóda vykreslenia grafu. The šou() potom sa použije metóda na zobrazenie grafu.
Predpokladajme, že chcete namiesto toho nakresliť krivku. Postup je rovnaký. Stačí zmeniť hodnoty zoznam pytónov pre os y.
import matplotlib.pyplot ako plt
x = [3,4,5,6,7,8,9,10,11,12]
y = [9,16,25,36,49,64,81,100,121,144]
plt.plot (x, y)
plt.show ()
Všimnite si niečo dôležité: v obidvoch grafoch neexistuje výslovná definícia mierky. Stupnica sa automaticky vypočíta a použije. Toto je jedna z mnohých zaujímavých funkcií, ktoré spoločnosť Juypter ponúka, vďaka ktorej sa namiesto starostí o kód môžete sústrediť na svoju prácu (analýza údajov).
Ak ste tiež ostražití, môžete si všimnúť, že počet hodnôt pre osi xay je rovnaký. Ak je niektorý z nich menší ako ten druhý, pri spustení kódu bude označená chyba a nebude sa zobrazovať žiadny graf.
Dostupné typy
Na rozdiel od spojnicového grafu a krivky vyššie je potrebné, aby sa mohli zobraziť iné vizualizácie grafu (napr. Histogram, stĺpcový graf atď.).
Stĺpcový graf
Na zobrazenie stĺpcového grafu budete musieť použiť bar() metóda.
import matplotlib.pyplot ako plt
x = [3,4,5,6,7,8,9,10,11,12]
y = [9,16,25,36,49,64,81,100,121,144]
plt.bar (x, y)
plt.show ()
Bodový diagram
Všetko, čo musíte urobiť, je použiť bodový () metóda v predchádzajúcom kóde.
import matplotlib.pyplot ako plt
x = [3,4,5,6,7,8,9,10,11,12]
y = [9,16,25,36,49,64,81,100,121,144]
plt.scatter (x, y)
plt.show ()
Koláčový graf
Koláčový graf sa trochu líši od zvyšku vyššie. Riadok 4 je obzvlášť zaujímavý, takže sa pozrite na jeho funkcie.
figsize sa používa na nastavenie pomeru strán. Môžete to nastaviť na čokoľvek, čo sa vám páči (napr. (9,5)), ale oficiálne dokumenty Pandas odporúčajú používať pomer strán 1.
import matplotlib.pyplot ako plt
x = [4,9,16,25,36]
fig = plt.figure (figsize = (9, 5)) # riadok 4
plt.pie (x)
plt.show ()
Pozoruhodné sú niektoré parametre, ktoré má koláčový graf:
štítky - To sa dá použiť na označenie každého rezu v koláčovom grafe.
farby - Týmto sa dajú dať každému z plátkov vopred definované farby. Farby môžete určiť v textovej podobe (napr. „Žltá“) alebo v hexadecimálnej podobe (napr. „# Ebc713“).
Pozrite si príklad nižšie:
import matplotlib.pyplot ako plt
x = [4,9,16,25,36]
fig = plt.figure (figsize = (5,5; 5,5))
plt.pie (x, labels = ("Guavas", "Bobule", "Mango", "Jablká", "Avokádo"),
colors = ("# a86544", "# eb5b13", "# ebc713", "# bdeb13", "# 8aeb13"))
plt.show ()
Existujú aj ďalšie pozemky ako hist, oblasti a kde že môžeš Prečítajte si viac informácií o dokumentoch Pandas.
Formátovanie grafu
Na obrázkoch vyššie nie sú žiadne aspekty, ako napríklad štítky. Takto to môžete urobiť.
Ak chcete pridať názov, vložte do svojho poznámkového bloku Jupyter kód uvedený nižšie:
matplotlib.pyplot.title ("Názov môjho grafu")
Osy x a y môžu byť označené nasledovne:
matplotlib.pyplot.xlabel ("môj štítok osi x")
matplotlib.pyplot.ylabel ("môj štítok na osi y")
Dozvedieť sa viac
Môžete spustiť Pomoc() príkazom v notebooku, aby ste získali interaktívnu pomoc o príkazoch Jupyter. Ak chcete získať viac informácií o konkrétnom objekte, môžete použiť pomoc (objekt).
Osvedčeným postupom bude tiež vyskúšať kreslenie grafov pomocou súborov údajov z súborov csvfiles. Naučiť sa, ako vizualizovať údaje, je mocný nástroj na komunikáciu a analýzu vašich zistení, takže stojí za to venovať nejaký čas rozvoju svojich schopností.
Pre pokročilú analýzu dát je Python lepší ako Excel. Tu je príklad, ako importovať údaje programu Excel do skriptu Python pomocou programu Pandas!
Prečítajte si Ďalej
- Programovanie
- Python
- Výukové programy pre kódovanie
- Analýza dát
Jerome je redaktorom štábu v MakeUseOf. Venuje sa témam o programovaní a Linuxe. Je tiež nadšencom kryptomien a neustále sleduje vývoj v kryptomene.
Prihlásiť sa ku odberu noviniek
Pripojte sa k nášmu bulletinu s technickými tipmi, recenziami, bezplatnými elektronickými knihami a exkluzívnymi ponukami!
Ešte jeden krok…!
V e-maile, ktorý sme vám práve poslali, potvrďte svoju e-mailovú adresu.