Čo je to webový prehľadávač/pavúk a ako to funguje?

Vyhľadávače ako Google sú súčasťou toho, čo robí internet tak silným. Niekoľkými stlačeniami kláves a kliknutím na tlačidlo sa zobrazia najrelevantnejšie odpovede na vašu otázku. Ale zamysleli ste sa niekedy nad tým, ako fungujú vyhľadávače? Webové prehľadávače sú súčasťou odpovede.

Čo je teda webový prehľadávač a ako funguje?

Čo je to webový prehľadávač?

Pixabay - nevyžaduje sa žiadne uvedenie zdroja

Keď hľadáte niečo vo vyhľadávači, musí motor rýchlo naskenovať milióny (alebo miliardy) webových stránok, aby zobrazil najrelevantnejšie výsledky. Webové prehľadávače (tiež známe ako pavúky alebo roboty vyhľadávacích nástrojov) sú automatické programy, ktoré „prehľadávajú“ internet a zostavujú informácie o webových stránkach ľahko prístupným spôsobom.

Slovo „plazenie“ označuje spôsob, akým webové prehľadávače prechádzajú internet. Webové prehľadávače sú známe aj ako „pavúky“. Tento názov pochádza z toho, ako sa plazia po webe - napríklad ako sa pavúky plazia po svojich pavučinách.

Webové prehľadávače posudzujú a zostavujú údaje o čo najväčšom počte webových stránok. Robia to tak, aby boli údaje ľahko dostupné a vyhľadateľné, a preto sú pre vyhľadávače také dôležité.

instagram viewer

Predstavte si webový prehľadávač ako editora, ktorý zostavuje register na konci knihy. Úlohou indexu je informovať čitateľa, kde sa v knihe nachádzajú všetky kľúčové témy alebo frázy. Rovnako tak webový prehľadávač vytvorí index, ktorý vyhľadávací nástroj používa na rýchle nájdenie relevantných informácií o vyhľadávacom dopyte.

Čo je indexovanie vyhľadávania?

Ako sme už spomenuli, indexovanie vyhľadávania je porovnateľné so zostavením indexu na zadnej strane knihy. Indexovanie vyhľadávania je svojim spôsobom ako vytváranie zjednodušenej mapy internetu. Keď niekto položí vyhľadávaciemu stroju otázku, vyhľadávací nástroj ho spustí prostredníctvom svojho indexu a ako prvé sa zobrazia najrelevantnejšie stránky.

Ako však vyhľadávací nástroj zistí, ktoré stránky sú relevantné?

Indexovanie vyhľadávania sa primárne zameriava na dve veci: text na stránke a metadáta stránky. Text je všetko, čo vidíte ako čitateľ, zatiaľ čo metadáta sú informácie o zadaní stránky tvorcom stránky, známe ako „meta tagy“. Meta tagy obsahujú veci, ako je popis stránky a meta názov, ktoré sa zobrazujú vo vyhľadávaní výsledky.

Vyhľadávače ako Google budú indexovať všetok text na webovej stránke (okrem určitých slov ako „the“ a „a“ v niektorých prípadoch). Keď je výraz vyhľadaný vo vyhľadávači, rýchlo vyhľadá jeho index pre najrelevantnejšiu stránku.

Ako funguje webový prehľadávač?

Pixabay - nevyžaduje sa žiadne uvedenie zdroja

Webový prehľadávač funguje, ako naznačuje názov. Začínajú na známej webovej stránke alebo adrese URL a indexujú každú stránku na tejto adrese URL (vlastníci webových stránok väčšinou požadujú, aby vyhľadávače prehľadávali konkrétne adresy URL. Keď na týchto stránkach narazia na hypertextové odkazy, zostavia zoznam úloh, ktoré budú ďalej prehľadávať. Webový prehľadávač bude v tejto činnosti pokračovať neobmedzene dlho, pričom sa bude riadiť konkrétnymi pravidlami o tom, ktoré stránky prehľadávať a ktoré ignorovať.

Webové prehľadávače neprechádzajú každú stránku na internete. V skutočnosti sa odhaduje, že iba 40-70% internetu bolo indexovaných vo vyhľadávaní (čo sú stále miliardy stránok). Mnoho webových prehľadávačov je navrhnutých tak, aby sa zameriavali na stránky, ktoré sa považujú za „autoritatívnejšie“. Autoritatívny stránky spĺňajú niekoľko kritérií, vďaka ktorým je väčšia pravdepodobnosť, že budú obsahovať vysokokvalitné alebo obľúbené informácie. Webové prehľadávače musia tiež dôsledne navštevovať stránky pri ich aktualizácii, odstraňovaní alebo presúvaní.

Posledným faktorom, ktorý určuje, ktoré stránky bude webový prehľadávač prehľadávať, je protokol robots.txt alebo protokol o vylúčení robotov. Server webovej stránky bude hostiteľom súboru robots.txt, ktorý stanoví pravidlá pre akýkoľvek prehľadávač webu alebo iné programy pristupujúce na stránku. Súbor vylúči prehľadávanie konkrétnych stránok a odkazy, ktoré môže prehľadávač sledovať. Jedným z účelov súboru robots.txt je obmedziť napätie, ktoré roboti kladú na server webovej stránky.

Aby ste zabránili webovému prehľadávaču v prístupe na určité stránky vášho webu, môžete pridať značku „zakázať“ prostredníctvom súbor robots.txt alebo pridajte noindex metaznačka na príslušnej stránke.

Aký je rozdiel medzi plazením a škrabaním?

Webové škrabanie je použitie robotov na sťahovanie údajov z webových stránok bez súhlasu týchto webových stránok. Webové škrabanie sa často používa zo škodlivých dôvodov. Webové škrabanie často preberá všetok kód HTML z konkrétnych webových stránok a pokročilejšie škrabky preberú aj prvky CSS a JavaScript. Nástroje na škrabanie webu môžu byť použité na rýchly a ľahký zber informácií o konkrétnych témach (povedzme, zoznam produktov), ale môžu sa do nich aj zatúlať sivé a nelegálne územia.

Indexové prehľadávanie webu je naopak indexovanie informácií na webových stránkach s povolením, aby sa mohli ľahko zobrazovať vo vyhľadávačoch.

Príklady prehľadávača webu

Každý hlavný vyhľadávací nástroj má jeden alebo viac webových prehľadávačov. Napríklad:

Google má Googlebot
Bing má Bingbot
DuckDuckGo má DuckDuckBot.

Väčšie vyhľadávače ako Google majú špecifické roboty pre rôzne zamerania, vrátane obrázkov Googlebot, videí Googlebot a AdsBot.

Ako indexové prehľadávanie webu ovplyvňuje SEO?

Pixabay - nevyžaduje sa žiadne uvedenie zdroja

Ak chcete, aby sa vaša stránka zobrazovala vo výsledkoch vyhľadávača, musí byť prístupná webovým prehľadávačom. V závislosti od servera vašej webovej stránky možno budete chcieť prideliť konkrétnu frekvenciu prehľadávania, ktoré stránky prehľadávač prehľadá a aký tlak môžu na váš server vyvinúť.

V zásade chcete, aby sa webové prehľadávače zameriavali na stránky plné obsahu, ale nie na stránky ako správy s poďakovaním, stránky správcu a interné výsledky vyhľadávania.

Informácie na dosah ruky

Používanie vyhľadávacích nástrojov sa pre väčšinu z nás stalo druhou prirodzenosťou, napriek tomu väčšina z nás nemá predstavu, ako fungujú. Webové prehľadávače sú jednou z hlavných častí efektívneho vyhľadávacieho nástroja a každý deň efektívne indexujú informácie o miliónoch dôležitých webových stránok. Sú neoceniteľným nástrojom pre majiteľov webových stránok, návštevníkov a vyhľadávače.

zdieľamTweetE -mail

Programovanie vs. Vývoj webu: Aký je rozdiel?

Môžete si myslieť, že programátori aplikácií a weboví vývojári robia rovnakú prácu, ale to nie je ani zďaleka pravda. Tu sú kľúčové rozdiely medzi programátormi a webovými vývojármi.

Čítajte ďalej

Súvisiace témy

Technológia vysvetlená
Web Search
Google vyhľadávanie
Hľadať triky

O autorovi

Jake Harfield (25 publikovaných článkov)

Jake Harfield je nezávislý spisovateľ so sídlom v austrálskom Perthe. Keď nepíše, zvyčajne je v kríku a fotografuje miestnu zver. Môžete ho navštíviť na www.jakeharfield.com

Viac od Jakea Harfielda

prihlásiť sa ku odberu noviniek

Pripojte sa k nášmu bulletinu a získajte technické tipy, recenzie, bezplatné elektronické knihy a exkluzívne ponuky!

Kliknutím sem sa prihlásite na odber

About Technology - denizatm.com

Čo je to webový prehľadávač/pavúk a ako to funguje?