Sitemaps
Formát sitemaps, který jsme 7.11.2007 spustili umožňuje majitelům stránek lépe komunikovat se Seznambotem. Díky sitemaps můžete určit, které stránky z webu by se měly častěji indexovat, protože o nich víte, že se jejich obsah často mění, nebo byl změněn. Tímto způsobem lze udržovat web aktuální a do větší hloubky zaindexovaný.
Aby Seznambot sitemapu našel a zpracoval, je vhodné mu říct, odkud ji má stahovat. K tomu je možné použít záznam v robots.txt - zápis je následující:
Sitemap: http://moje.domena.cz/map/sitemap.xml
URL se sitemapou musí být v robots.txt absolutní.
Sitemapy jsou kompatibilní s googlem i sitemaps.org, rozdíl je pouze v odlišném XML namespace, podporovány jsou obě možnosti.
Dle sitemaps.org/protocol.php je velikost sitemapy limitována na 10MB (v dekomprimovaném stavu) nebo 50 000 url, což podporujeme. Větší sitemapy musí být rozděleny a vytvořen sitemap index. Z důvodu rychlosti zpracování však doporučujeme sitemapy vytvářet raději menší.
TIP!
Sitemapa může být v libovolném skriptovacím jazyce, za předpokladu, že vrátí přípustný Content-Type (application/xml) a její URL bude v robots.txt. Více informací k formátu sitemaps najdete na www.sitemaps.org
Komprimované sitemapy:
Lze použít komprimaci metodou gz. Na takovouto sitemapu lze dát odkaz do robots.txt (Sitemap: http://moje.domena.cz/map/sitemap.gz). Další možností je použít standardní název sitemap.xml a v hlavičkách posílat application/x-gzip.
Veškeré priority ze sitemap.xml slouží pouze k rozhodování robota v rámci webu, nemají tedy žádný vliv na pořadí stránek ve výsledcích hledání, stejně jako nemá žádný význam nastavit prioritu všech stránek na 1 (aby priorita robotovi k něčemu byla, měla by se u jednotlivých URL lišit)