Odstraňování stránek


Stránka je z indexu automaticky odstraněna v případě, kdy robot zjistí, že:

  • server vrací u této stránky jeden z HTTP stavů 404, 410;
  • je zakázána její indexace v meta tagu robots v HTML textu stránky;
  • automatické indexaci brání jiná překážka (např. chybný DNS záznam domény, nedostupnost DNS serverů nebo serveru, kde je web hostován).

Pokud si přejete z indexu odstranit neexistující nebo nadále neplatnou stránku, použijte HTTP stav 404 nebo 410 (viz níže).

Pokud si přejete vaši stránku odstranit z výsledků vyhledávání na Seznamu, ale nechat ji přístupnou pro lidi, zakažte její indexaci pomocí meta tagu robots.

POZOR

Vymazání stránek z indexu může zajistit pouze provozovatel stránek nastavením některého z výše uvedených stavů.

Odstraňování pomocí stavů 404 a 410

Tuto metodu použijte, pokud chcete z indexu odstranit již neexistující nebo neplatné stránky.
Význam stavů je následovný:

  • 404 – Not Found: Stránku nelze nalézt. Tento stav vzniká ve chvíli, kdy server na požadované adrese nenajde původní platný obsah. Vzniká automaticky při požadavku na jakoukoliv neplatnou adresu, ale může být nastaven i ručně správcem webu pro jakoukoliv adresu na webu.
  • 410 – Gone: Požadovaná stránka byla trvale odstraněna. Tento stav znamená, že stránka na této adrese existovala, ale již neexistuje, popř. byla zrušena její platnost. Nastavit ho může správce webu pro jakoukoliv adresu na webu.

Zpracování stavů vyhledávačem

Po zjištění stavu 404 na stránce jej robot několikrát ověřuje a stránku z výsledků odstraní, až když se potvrdí, že stav 404 je dlouhodobý a přetrvává. Je to proto, že tento stav často vzniká omylem nebo pouze krátkodobě při změnách na webu a je v zájmu všech stran, aby stránka ve výsledcích vyhledávání zůstala.

Po zjištění stavu 410 robot dále tento stav neověřuje a rovnou stránku označí na odstranění z výsledků vyhledávání. K odstranění tak dojde podstatně rychleji, než při použití stavu 404.

TIP

Stav 410 doporučujeme zejména v případě stránek s inzeráty a jiným rychle zastarávajícím obsahem. Proces odstranění je pak efektivnější - není třeba parsovat obsah stránky. Stránky, které vrací stav 410 mohou nadále obsahovat původní text - jejich vyřazování to neovlivní.