Vyhľadávače ako Google sú súčasťou toho, čo robí internet tak silným. Niekoľkými stlačeniami kláves a kliknutím na tlačidlo sa zobrazia najrelevantnejšie odpovede na vašu otázku. Ale zamysleli ste sa niekedy nad tým, ako fungujú vyhľadávače? Webové prehľadávače sú súčasťou odpovede.
Čo je teda webový prehľadávač a ako funguje?
Čo je to webový prehľadávač?
Keď hľadáte niečo vo vyhľadávači, musí motor rýchlo naskenovať milióny (alebo miliardy) webových stránok, aby zobrazil najrelevantnejšie výsledky. Webové prehľadávače (tiež známe ako pavúky alebo roboty vyhľadávacích nástrojov) sú automatické programy, ktoré „prehľadávajú“ internet a zostavujú informácie o webových stránkach ľahko prístupným spôsobom.
Slovo „plazenie“ označuje spôsob, akým webové prehľadávače prechádzajú internet. Webové prehľadávače sú známe aj ako „pavúky“. Tento názov pochádza z toho, ako sa plazia po webe - napríklad ako sa pavúky plazia po svojich pavučinách.
Webové prehľadávače posudzujú a zostavujú údaje o čo najväčšom počte webových stránok. Robia to tak, aby boli údaje ľahko dostupné a vyhľadateľné, a preto sú pre vyhľadávače také dôležité.
Predstavte si webový prehľadávač ako editora, ktorý zostavuje register na konci knihy. Úlohou indexu je informovať čitateľa, kde sa v knihe nachádzajú všetky kľúčové témy alebo frázy. Rovnako tak webový prehľadávač vytvorí index, ktorý vyhľadávací nástroj používa na rýchle nájdenie relevantných informácií o vyhľadávacom dopyte.
Čo je indexovanie vyhľadávania?
Ako sme už spomenuli, indexovanie vyhľadávania je porovnateľné so zostavením indexu na zadnej strane knihy. Indexovanie vyhľadávania je svojim spôsobom ako vytváranie zjednodušenej mapy internetu. Keď niekto položí vyhľadávaciemu stroju otázku, vyhľadávací nástroj ho spustí prostredníctvom svojho indexu a ako prvé sa zobrazia najrelevantnejšie stránky.
Ako však vyhľadávací nástroj zistí, ktoré stránky sú relevantné?
Indexovanie vyhľadávania sa primárne zameriava na dve veci: text na stránke a metadáta stránky. Text je všetko, čo vidíte ako čitateľ, zatiaľ čo metadáta sú informácie o zadaní stránky tvorcom stránky, známe ako „meta tagy“. Meta tagy obsahujú veci, ako je popis stránky a meta názov, ktoré sa zobrazujú vo vyhľadávaní výsledky.
Vyhľadávače ako Google budú indexovať všetok text na webovej stránke (okrem určitých slov ako „the“ a „a“ v niektorých prípadoch). Keď je výraz vyhľadaný vo vyhľadávači, rýchlo vyhľadá jeho index pre najrelevantnejšiu stránku.
Ako funguje webový prehľadávač?
Webový prehľadávač funguje, ako naznačuje názov. Začínajú na známej webovej stránke alebo adrese URL a indexujú každú stránku na tejto adrese URL (vlastníci webových stránok väčšinou požadujú, aby vyhľadávače prehľadávali konkrétne adresy URL. Keď na týchto stránkach narazia na hypertextové odkazy, zostavia zoznam úloh, ktoré budú ďalej prehľadávať. Webový prehľadávač bude v tejto činnosti pokračovať neobmedzene dlho, pričom sa bude riadiť konkrétnymi pravidlami o tom, ktoré stránky prehľadávať a ktoré ignorovať.
Webové prehľadávače neprechádzajú každú stránku na internete. V skutočnosti sa odhaduje, že iba 40-70% internetu bolo indexovaných vo vyhľadávaní (čo sú stále miliardy stránok). Mnoho webových prehľadávačov je navrhnutých tak, aby sa zameriavali na stránky, ktoré sa považujú za „autoritatívnejšie“. Autoritatívny stránky spĺňajú niekoľko kritérií, vďaka ktorým je väčšia pravdepodobnosť, že budú obsahovať vysokokvalitné alebo obľúbené informácie. Webové prehľadávače musia tiež dôsledne navštevovať stránky pri ich aktualizácii, odstraňovaní alebo presúvaní.
Posledným faktorom, ktorý určuje, ktoré stránky bude webový prehľadávač prehľadávať, je protokol robots.txt alebo protokol o vylúčení robotov. Server webovej stránky bude hostiteľom súboru robots.txt, ktorý stanoví pravidlá pre akýkoľvek prehľadávač webu alebo iné programy pristupujúce na stránku. Súbor vylúči prehľadávanie konkrétnych stránok a odkazy, ktoré môže prehľadávač sledovať. Jedným z účelov súboru robots.txt je obmedziť napätie, ktoré roboti kladú na server webovej stránky.
Aby ste zabránili webovému prehľadávaču v prístupe na určité stránky vášho webu, môžete pridať značku „zakázať“ prostredníctvom súbor robots.txt alebo pridajte noindex metaznačka na príslušnej stránke.
Aký je rozdiel medzi plazením a škrabaním?
Webové škrabanie je použitie robotov na sťahovanie údajov z webových stránok bez súhlasu týchto webových stránok. Webové škrabanie sa často používa zo škodlivých dôvodov. Webové škrabanie často preberá všetok kód HTML z konkrétnych webových stránok a pokročilejšie škrabky preberú aj prvky CSS a JavaScript. Nástroje na škrabanie webu môžu byť použité na rýchly a ľahký zber informácií o konkrétnych témach (povedzme, zoznam produktov), ale môžu sa do nich aj zatúlať sivé a nelegálne územia.
Indexové prehľadávanie webu je naopak indexovanie informácií na webových stránkach s povolením, aby sa mohli ľahko zobrazovať vo vyhľadávačoch.
Príklady prehľadávača webu
Každý hlavný vyhľadávací nástroj má jeden alebo viac webových prehľadávačov. Napríklad:
- Google má Googlebot
- Bing má Bingbot
- DuckDuckGo má DuckDuckBot.
Väčšie vyhľadávače ako Google majú špecifické roboty pre rôzne zamerania, vrátane obrázkov Googlebot, videí Googlebot a AdsBot.
Ako indexové prehľadávanie webu ovplyvňuje SEO?
Ak chcete, aby sa vaša stránka zobrazovala vo výsledkoch vyhľadávača, musí byť prístupná webovým prehľadávačom. V závislosti od servera vašej webovej stránky možno budete chcieť prideliť konkrétnu frekvenciu prehľadávania, ktoré stránky prehľadávač prehľadá a aký tlak môžu na váš server vyvinúť.
V zásade chcete, aby sa webové prehľadávače zameriavali na stránky plné obsahu, ale nie na stránky ako správy s poďakovaním, stránky správcu a interné výsledky vyhľadávania.
Informácie na dosah ruky
Používanie vyhľadávacích nástrojov sa pre väčšinu z nás stalo druhou prirodzenosťou, napriek tomu väčšina z nás nemá predstavu, ako fungujú. Webové prehľadávače sú jednou z hlavných častí efektívneho vyhľadávacieho nástroja a každý deň efektívne indexujú informácie o miliónoch dôležitých webových stránok. Sú neoceniteľným nástrojom pre majiteľov webových stránok, návštevníkov a vyhľadávače.
Môžete si myslieť, že programátori aplikácií a weboví vývojári robia rovnakú prácu, ale to nie je ani zďaleka pravda. Tu sú kľúčové rozdiely medzi programátormi a webovými vývojármi.
Čítajte ďalej
- Technológia vysvetlená
- Web Search
- Google vyhľadávanie
- Hľadať triky
Jake Harfield je nezávislý spisovateľ so sídlom v austrálskom Perthe. Keď nepíše, zvyčajne je v kríku a fotografuje miestnu zver. Môžete ho navštíviť na www.jakeharfield.com
prihlásiť sa ku odberu noviniek
Pripojte sa k nášmu bulletinu a získajte technické tipy, recenzie, bezplatné elektronické knihy a exkluzívne ponuky!
Kliknutím sem sa prihlásite na odber