Robots.txt 2.0

Vyhledávání Seznam.cz podporuje také standard robots.txt ve verzi 2.0. Jeho syntaxe je oproti původní verzi rozšířena povolením regulárních výrazů známých z unixového shellu. Použití robots.txt verze 2.0 je potřeba SeznamBotovi oznámit. Slouží k tomu příkaz Robot-version: 2.0, který musí být vždy na druhém řádku bloku, za direktivou User-agent.

Příklad použití robots.txt ve verzi 2.0

User-agent: *
Robot-version: 2.0
Disallow: /

Zástupné znaky verze 2.0

V robots.txt verze 2.0 lze používat následující zástupné znaky:

* zastupuje jakoukoliv posloupnost znaků (včetně případu 0 znaků)
? zastupuje jakýkoliv jeden znak
\ následující speciální znak (např. ?, *, ...) bude chápán doslovně - např. výrazu /file\? bude vyhovovat pouze cesta začínající /file?, ale cesta /files už ne.
[<množina znaků>] zastupuje libovolný znak z dané množiny
[!<množina znaků>]
nebo
[^<množina znaků>]
zastupuje libovolný znak neobsažený v dané množině

POZOR

Na rozdíl od robots.txt verze 1.0 se neporovnává jen začátek, ale celá URL. To znamená, že například Disallow: /helpme zakazuje jen URL /helpme. Původní funkcionality z verze 1.0 (zákaz stahování stránek, které začínají zadaným řetězcem) dosáhneme přidáním zástupného znaku * (hvězdička) na konec řetezce: Disallow: /helpme*. To samé platí i pro direktivu Allow:.

Pomohl Vám tento článek? Ne

Kontaktujte nás