Kódování
Kódování je způsob, jak zapisovat znaky abecedy pomocí bajtů tak, aby bylo možné výslednou posloupnost bajtů zase převést zpět na znaky abecedy. Příkladem kódování je např. ASCII, UTF-8 nebo ISO-8859-2.
Pro spolehlivou indexaci stránek je potřeba, aby kódování webové stránky bylo deklarováno v textu každé stránky. V praxi se totiž nelze spoléhat na to, že SeznamBot kódování rozpozná na základě informací získaných z hlaviček, které posílá webový server. Ten může indikovat kódování chybně či dokonce ho nemusí indikovat vůbec.
Existuje velké množství různých kódování. SeznamBot v současnosti podporuje tato kódování:
iso-8859-2, windows-1250, utf-8, utf-16
POZOR
Stránky s jiným než výše uvedeným kódováním se do indexu nedostanou. Dejte si pozor na to, aby editor, ve kterém své stránky tvoříte, měl nastavené stejné kódování, jaké deklarujete v hlavičce stránky.
Kódování se deklaruje v bloku <head></head>
HTML dokumentu pomocí meta tagu <meta http-equiv="Content-Type">
. Pokud tvoříte stránky v HTML5, můžete využít o něco jednodušší meta tag <meta charset>
. Ten musí být umístěn před prvky, které obsahují text (např. <title>
).
Příklad zápisu kódování pomocí meta http-equiv
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
</head>
<body>
...
Příklad zápisu kódování pomocí meta charset
<html>
<head>
<meta charset="utf-8"> </title>Titulek stránky</title>
</head>
<body>
...