Hľadáte bezplatné údaje, aby ste si precvičili svoje zručnosti v oblasti analýzy údajov? Tu sú niektoré z najlepších webových stránok, ktoré môžete vyskúšať.
Či už robíte prieskum trhu, budujete svoje portfólio ako analytik alebo hľadáte poznatky na rozšírenie svojho dosahu na trh, cenné a spoľahlivé údaje sú nevyhnutné pre informované rozhodovanie.
Hľadanie bezplatných, spoľahlivých a dostupných údajov na internete má však určité problémy. Tento článok vám uľahčí hľadanie údajov tým, že vám predstaví niektoré z najlepších webových stránok, kde získate prístup k bezplatným údajom.
Google Trends je bezplatná služba vyvinutá spoločnosťou Google, ktorá používateľom poskytuje nefiltrované vzorky údajov z vyhľadávacích požiadaviek odoslaných spoločnosti Google. Aj keď táto služba zobrazuje údaje o časových radoch od roku 2004 po súčasnosť na globálnej úrovni aj na úrovni miest, nezobrazuje osobné údaje používateľov vyhľadávacieho nástroja.
Môžete tiež obmedziť údaje tak, aby sa zamerali na kategórie, jazyky, entity alebo
trendové vyhľadávania na Googli pomocou služby Google Trends. Príklady dostupných údajov zahŕňajú denné trendy vyhľadávania a trendy vyhľadávania v reálnom čase, ktoré zobrazujú údaje za posledných sedem dní.FiveThirtyEight je webová stránka pre dátovú žurnalistiku, ktorá obsahuje údaje o analýze prieskumov verejnej mienky, športe, popkultúre, politike, vede a ekonomických udalostiach.
Skvelá vec na webovej stránke je, že si môžete stiahnuť údaje z ich webovej stránky alebo ich oficiálne úložisko GitHub a použite svoj nástroje na vizualizáciu dát na vytváranie podmanivých vizuálov dátovej žurnalistiky pre vaše publikum. Niekoľko príkladov zaujímavých dostupných údajov zahŕňa napr predpovede svetového pohára a Údaje predpovedí NHL na roky 2022 – 2023.
BuzzFeed News je americká mimoriadna spravodajská a originálna spravodajská platforma, ktorá informuje o všetkom od žurnalistiky, techniky, zábavy, správ o celebritách, kultúre a DIY hackoch až po zdravie a politiku.
BuzzFeed News na svojom GitHub sprístupňuje množinu údajov, nástroje a analýzy z redakcie BuzzFeed ako open source, prístup a dostupnosť. Príklad zahŕňa Údaje o kontrole strelných zbraní FBI NICS.
Data.gov je webová stránka vlády Spojených štátov amerických s otvorenými údajmi, ktorá obsahuje viac ako 250 000 verejne dostupných, dobre zdokumentovaných súborov údajov od medzinárodných a viacerých federálnych vládnych agentúr. Myšlienkou tejto iniciatívy bolo poskytnúť otvorenú a transparentnú vládu.
K údajom z webovej stránky máte prístup na základe témy a agentúry alebo organizácie. Niektoré príklady údajov, ktoré môžete nájsť na stránke Data.gov, sú národný systém údajov o študentských pôžičkách a údaje o počte obyvateľov elektrických vozidiel.
Kaggle je verejné dátové ihrisko získané spoločnosťou Google, ktoré ponúka širokú škálu súborov údajov na rôzne témy. Táto komunitná platforma vám umožňuje zdieľať svoje kódy, učiť sa, spolupracovať s ostatnými odborníkmi na údaje a zlepšovať sa. Kaggle tiež organizuje súťaže v oblasti dátovej vedy, kde môžete vyhrať rôzne ceny.
Táto príručka poskytuje a príručka pre začiatočníkov o tom, ako začať s Kaggle pre vedu o údajoch. Príkladom je Globálne štatistiky YouTube 2023.
EarthData je dátová iniciatíva NASA, ktorá slúži ako úložisko dát o Zemi od roku 1994 doteraz. Môžete získať údaje súvisiace zo vzdialených satelitných informácií s údajmi o zemskej atmosfére, oceánoch a suchozemskej hydrosfére.
Môžete si prezerať rôzne témy a pristupovať k údajom ako napr údaje o extrémnom teple. Budete však musieť preskúmať Planetárny dátový systém NASA pre nepozemské údaje.
IMDb poskytuje údaje o filmoch, televíznych seriáloch, domácich videách, podcastoch, videohrách, streamovaných informáciách a obsahu celebrít. Príkladom je IMDb nekomerčné súbory údajov.
AWS Public Dataset je webová stránka, ktorá hosťuje viac ako 3 000 súborov údajov množín údajov sprístupnených verejnosti prostredníctvom služieb AWS. Väčšina súborov údajov tu je založená na projekte. Niektoré zahŕňajú atlas genómu rakoviny a Foldingathome množiny údajov COVID-19.
Inside Airbnb je webová stránka s dozorom, ktorú spustil Murray Cox. Táto webová stránka pochádza z verejne dostupných údajov Airbnb, platforma, ktorá ponúka používateľom cenovo výhodné izby po celom svete. Informácie z tejto stránky môžete použiť na vykonávanie analýz, ako je napr analytika prenájmu Montrealu.
Google Dataset Search je vyhľadávač množín údajov vytvorený spoločnosťou Google, ktorý hostí viac ako 20 miliónov množín údajov. Rovnako ako ich vyhľadávač, môžete získať údaje takmer z čohokoľvek. Dobrým príkladom je Kanadské národné údaje z dlhodobého monitorovania kvality vody.
UC Irvine Machine Learning Repository je domovom 624 súborov údajov pre komunitu strojového učenia na svete. Táto webová stránka má v komunite dobrú povesť, pretože súbory údajov sú kategorizované na základe úloh strojového učenia, na ktoré sú vhodné. Príkladom je Súbor údajov o dúhovke, slávny klasifikačný a klastrový model údajový súbor.
Datahub ako platforma má veľa súborov údajov, ktoré pokrývajú širokú škálu tém, ako je napr Výnosy 10-ročných vládnych dlhopisov USA (dlhodobá úroková sadzba). Okrem údajov zobrazujú aj dátové nástroje a súpravy nástrojov, ktoré môžu byť pre dátových profesionálov užitočné.
Toto je prvá webová stránka na našom zozname pre exkluzívne zdravotné údaje. Globálne observatórium zdravia slúži ako úložisko údajov, ktoré zobrazuje štatistiky týkajúce sa zdravia pre viac ako 1000 ukazovateľov pre 194 členských štátov WHO. Údaje sa zaznamenávajú na monitorovanie pokroku týchto členských štátov pri dosahovaní cieľov udržateľného rozvoja. Údaje môžete získať filtrovaním témy, kategórie, metadát a indikátora údajov.
Táto platforma je skutočne založená. Zobrazuje údaje z výskumu a informácie o trhu, ako napr čísla víkendových pokladníc a súvisiace údaje o filmovom priemysle Spojeného kráľovstva.
GitHub je viac než len domov miliónov spoločných a open-source projektov. Platforma tiež hostí mnoho úložísk, ktorých cieľom je uchovávať bezplatné, verejné a open source súbory údajov. Dokonca BuzzFeedNews má úložisko GitHub s otvoreným zdrojom.
Ďalšími príkladmi sú Úžasné úložisko verejných množín údajov a zdvihnete vôbec súbor údajov. Môžete tiež prispievať k týmto open-source projektom na GitHub.
Data.world je dátová komunita a platforma na spoluprácu, ktorá hostí dátové projekty a množiny dát. Zatiaľ čo niekoľko súborov údajov je platených, väčšina údajov na platforme, ako napr Pondelok premeny 2021/W16: mesační cestujúci leteckou dopravou v Amerike, sú bezplatné a dajú sa jednoducho stiahnuť lokálne alebo k nim pristupovať cez ich API.
Otvorené údaje Svetovej banky sú katalógom globálnych ekonomických a rozvojových údajov. Môžete prehliadať a filtrovať údaje, napr globálne štatistiky o nákladoch a dostupnosti zdravej výživy podľa ukazovateľa a krajiny.
Nasdaq Data Link je pre všetky finančné, ekonomické a alternatívne údaje. Môžete pristupovať k údajom ako napr Zverejnenie údajov o federálnych rezervách USA prostredníctvom tabuľky, ako je Excel alebo API.
Dátová platforma NYC Taxi and Limousine Commission zaznamenáva a hostí informácie ako napr záznamy žltých a zelených taxíkov v New Yorku. Skvelé na tejto webovej stránke je, že zobrazuje informácie o všetkom, od vyzdvihnutia/odovzdania až po zónu taxíkov a cestovné.
Academic Torrents je dátový katalóg s viac ako 127,15 TB výskumných dát. Bol postavený, ako sa hovorí, pre výskumníkov a výskumníkmi.
Skúmajte a učte sa
Dúfajme, že s týmto zoznamom môžete získať údaje, ktoré môžu formovať vaše obchodné prostredie, riadiť váš prieskum trhu, získať konkurenčnú výhodu a pomôcť vám bezplatne vybudovať toto jedinečné dátové portfólio. Využite teda príležitosti, preskúmajte a urobte si menej náročnú úlohu pri hľadaní údajov.