Keď používate Tabuľky Google na prácu s dvoma množinami údajov, možno budete chcieť tieto dve porovnať určením miery, do akej jedna ovplyvňuje druhú.

Korelácie môžu poskytnúť pohľad na to, či existuje prediktívny vzťah medzi rovinami x a y, ale nemusia nevyhnutne naznačovať kauzalitu. Tu je návod, ako môžete použiť Tabuľky Google na identifikáciu korelácií vo svojich údajoch.

Čo je korelácia a na čo ju môžete použiť?

Keď sú dve premenné korelované, jedna môže určiť, ako premenná ovplyvňuje druhú. Je však dôležité si uvedomiť, že korelácia v tomto prípade neznamená spoliehanie sa; len ukazuje, ako blízko a rýchlo sa dve premenné porovnávajú alebo súvisia.

Štatistické metriky pomáhajú pochopiť základné trendy v analýze údajov. Korelácia patrí medzi najčastejšie používané štatistické metriky a určuje, ako úzko súvisia alebo závisia dve premenné.

Pochopenie korelačného koeficientu v Tabuľkách Google

V Tabuľkách Google sa korelačný koeficient vypočítava pomocou funkcie CORREL. Korelačný koeficient slúži ako meradlo toho, ako úzko sú súbory údajov prepojené. Môže sa použiť na získanie Pearsonovho korelačného koeficientu produktu a momentu (r), ak máte dva premenné súbory údajov. Ak sa chcete dozvedieť viac o tomto koeficiente, môžete si prečítať viac v tejto príručke od

instagram viewer
Štatistiky spoločnosti Leard.

Dalo by sa naraziť na jednu z troch korelačných metrík. Každé meranie definuje vzťahy medzi premennými inak. Jeho hodnota je medzi -1 a +1:

  • -1 označuje dokonalú negatívnu koreláciu: Ak má korelácia koeficient korelácie rovný alebo nižší ako -0,9, uvádza sa, že je silne negatívna. Je to znak toho, že údaje sú v korelácii. Premenná x však stále rastie, zatiaľ čo premenná y stále klesá.
  • 0 znamená žiadne spojenie: Premenné sa považujú za nekorelujúce, ak je korelačný koeficient väčší ako 0,01, ale menší ako 0,1, pretože medzi každou premennou nie je rozlíšiteľný vzťah. Sú na sebe nezávislé.
  • +1 označuje dokonalú pozitívnu koreláciu: Keď korelačný koeficient klesne medzi 0,9 a 1, považuje sa za vysoko pozitívny. Znamená to, že došlo k nárastu v dvoch súboroch premenných.

Najvyššou hodnotou koeficientu mohol byť korelačný koeficient 1. Keď je korelačná hodnota 1, znamená to, že ak by ste údaje vykreslili do grafu, boli by úplne zarovnané, aby vytvorili priamku.

Ak ste stále trochu stratení, nebojte sa. Vysvetlíme vám syntax funkcie CORREL a potom sa ponoríme do niekoľkých príkladov z reálneho sveta, ktoré vám pomôžu lepšie jej porozumieť. Pochopenie línií, ktoré najlepšie padnú a ako vytvoriť trendové čiary v Tabuľkách Google vám s tým pomôže.

Syntax funkcie CORREL v Tabuľkách Google

=CORREL(údaje_y, údaje_x) 

Poďme si to rozdeliť na jednotlivé časti a lepšie pochopiť, čo každá fráza znamená:

  • =CORREL: Toto je funkcia Google Sheet, ktorá určuje r (Pearsonov korelačný koeficient produktu a momentu súboru údajov).
  • data_y: Vzťahuje sa na skupinu buniek obsahujúcich závislé údaje alebo rozsah hodnôt pre tieto bunky.
  • údaje x: Toto je buď odkaz na pole buniek s nezávislými údajmi alebo rozsah hodnôt pre tieto bunky.

Ak by ste mali vykresliť dátové body do grafu, data_y by bola os Y a data_x os X. Všimnete si, že existujú dva rôzne spôsoby, ako zadať rozsah údajov. Možnosti sú buď rozsah referenčných buniek, alebo priame zadávanie údajov do funkcie.

Vo väčšine prípadov je vhodnejšie použiť rozsah referenčných buniek. Je to preto, že tabuľka s najväčšou pravdepodobnosťou už obsahuje vaše údaje. Použitím rozsahu referenčných buniek sa môžete vyhnúť nadmernému zadávaniu, ktoré môže viesť k chybe používateľa.

Príklady funkcií CORREL v Tabuľkách Google

Pozrime sa na niekoľko príkladov, aby sme pochopili, ako používať funkciu CORREL v Tabuľkách Google.

Príklad 1: Silná pozitívna korelácia

Pre tento prvý príklad si predstavme, že pracujeme v realitnom priemysle. V tabuľke nižšie máme časti hektárov pôdy, ktoré predávate, a počet predaných jednotiek údajov týchto rôznych pozemkov vo vašej tabuľke Google.

  1. Ak postupujete v hárku, začnite zadaním údajov premenných do tabuľky, ako je uvedené nižšie:
  2. Kliknite na bunku C2
  3. Typ =CORREL(
  4. Potom prejdete na typ data_y, čo je v našom prípade referenčný rozsah buniek A2:A6, potom zadajte čiarku.
  5. Pokračujte typom data_x, ktorý sa v našom prípade označuje ako B2:B6.
  6. Ukončite uzatváracou zátvorkou, ako je znázornené nižšie:
  7. Nakoniec stlačte Zadajte vrátiť korelačný koeficient dvoch údajov v bunke C2.

Pomocou vyššie uvedeného príkladu ste získali korelačný koeficient 0,90, čo je silná pozitívna korelácia, pretože jeho hodnota spadá medzi 0,9 a 1. Znamená to teda, že ako sa mení y, mení sa aj x v podstate porovnateľným spôsobom.

Nižšie je znázornené naše vzorové vzorové údaje na XY grafe. Ako môžete vidieť, čiara najlepšieho prispôsobenia sa nachádza v blízkosti údajových bodov v grafe, čo podporuje myšlienku, že čísla sú silne korelované.

Môžete sa dozvedieť viac o vytváranie XY rozptylových grafov v Tabuľkách Google v našom ďalšom článku.

Príklad 2: Slabá negatívna korelácia

Tentokrát v našej tabuľke použijeme všeobecnejší príklad „premenných x a y“. Zámerne sme zahrnuli čísla, aby sme demonštrovali negatívnu koreláciu, ktorú funkcia CORREL demonštruje nižšie:

Medzi premennými y a x nie je silný vzťah, takže výsledkom, ktorý dostaneme, je menej významný korelačný koeficient ako v predchádzajúcom príklade. Výsledok, ktorý sme dosiahli je -0,47. To však neznamená, že neexistuje žiadna korelácia. Pozrime sa znova na rad, ktorý najlepšie vyhovuje, aby sme to pochopili.

Ako môžete vidieť z bodového grafu, dátové body sú ďalej od čiary, ktorá najlepšie vyhovuje. Existuje teda menšia korelácia ako v prvom príklade, ale nie žiadna. Tiež si všimnete, že línia najlepšieho prispôsobenia sa znižuje. To ukazuje negatívnu koreláciu, jedna hodnota klesá ako druhá rastie.

Príklad 3: Žiadne spojenie

Tu máme množinu úplne náhodných čísel. Poďme sa rýchlo dotknúť toho, ako znova použiť funkciu CORREL:

  1. Zadajte bunku C2 vzorec CORREL
  2. Naše argumenty sú A2:A10 a B2:B10
  3. Stlačte Enter

Hodnota vrátená na C2 je 0,02. Ak korelačný koeficient klesne medzi 0,01 a 0,1, určí sa, že príslušné premenné nekorelujú, pretože medzi nimi nie je rozlíšiteľné spojenie. Vzťahy medzi premennými sú úplne nezávislé.

Nižšie je znázornenie toho istého na bodovom grafe. Čiara najlepšieho prispôsobenia je takmer plochá, čo naznačuje malú koreláciu medzi týmito dvoma súbormi údajov.

Ľahko korelujte svoje údaje v Tabuľkách Google

Korelácia môže byť náročná téma, ak ste s ňou na strednej škole veľa nepracovali. Táto príručka pokrývala všetky základy, ale budete musieť naďalej používať funkciu CORREL v Tabuľkách Google, aby ste si ju udržali v pamäti.

Ide o výkonnú funkciu, ktorá pomáha vyhnúť sa vytváraniu rozptylových grafov a dokáže rýchlo nájsť trendy vo vašich údajoch. Napriek tomu sa nebojte pridať grafy, ktoré pomôžu ostatným používateľom lepšie porozumieť údajom vo vašich tabuľkách.