Množství informací uložených na internetu je obrovské. Mezi těmito daty není možné nic ručně najít. Vyhledávací stroje jsou vyzvány k automatizaci procesu. Jsou to výpočetní systémy, které organizují data a vyhledávají podle dotazů.
Instrukce
Krok 1
Na serverech vyhledávacích strojů jsou neustále spuštěny programy zvané roboti. Bot je zkratka pro robota. Svým chováním se opravdu podobají robotům. Pravidelnou návštěvou každé stránky ze seznamu uloženého na serveru přinášejí místní kopie všech textů do souladu s aktuálními verzemi stejných textů na webových stránkách. Boti sledují všechny odkazy, se kterými se setkají, a pokud najdou nově vytvořenou stránku, přidají ji do seznamu a také vytvoří místní kopii. Kopie se nezveřejňují na internetu - jsou pouze nedílnou součástí procesu získávání seznamu webů. To znamená, že nedochází k porušení autorských práv.
Krok 2
Zkuste zadat stejnou frázi několikrát do stejného vyhledávače. Zjistíte, že výsledky se pokaždé seřadí ve stejném pořadí. Zřídka se mění, ne častěji než jednou denně. Důvod je jednoduchý - pořadí výsledků vyhledávání určuje poměrně složitý algoritmus. Výpočet zohledňuje frekvenci používání určitých slov na stránkách, počet odkazů na tuto stránku umístěných na jiných webech a řadu dalších faktorů.
Krok 3
Majitelé webových stránek, kteří se snaží dostat své zdroje na začátek tohoto seznamu, optimalizují texty, které jsou na nich zveřejněny. Tato optimalizace může být „bílá“- přímo povolená pravidly „vyhledávačů“, „šedá“- není povolena, ale není zakázána, stejně jako „černá“- přímo zakázána. V druhém případě může stránka brzy navždy zmizet ze seznamu. Optimalizační algoritmy jsou často složitější než algoritmy třídění výsledků vyhledávání.
Krok 4
Po zadání klíčového slova nebo fráze program na serveru vyhledá shody ve všech místních kopiích textů. Výsledky jsou poté tříděny pomocí výše uvedeného složitého algoritmu. Systém pro správu obsahu poté automaticky vygeneruje stránku, která je předána prohlížeči. Na žádost uživatele lze vygenerovat následující stránky seznamu: druhá, třetí atd.