Jak přidat sitemapu do Seznamu a Google
Mapu webu v souboru sitemap.xml
je vhodné přidat do Googlu, Seznamu nebo Bingu. Jak na to?
V případě rozsáhlejšího webu se hodí vytvořit jeho strojově čitelnou mapu – tzv. soubor sitemap.
Proč mapu webu vytvářet
Sitemapa není rozhodně nezbytná součást webu. Může se ale hodit pro usnadnění procházení webu vyhledávači.
Normálně roboti vyhledávačů procházejí jednotlivé stránky a v kódu hledají odkazy <a href>
na další stránky, které by ještě mohly zaindexovat.
Vygenerovaná mapa webu sitemap.xml
potom obsahuje strojově čitelný seznam všech adres webu – to může vyhledávači usnadnit nacházení nových stránek – pro objevení nových stránek stačí porovnat adresy v souboru sitemap.xml
.
Mapa webu se hodí i v případě, kdy na všechny podstránky nevedou odkazy nebo jsou hodně zahrabané v struktuře webu. Ideální ale samozřejmě je se tomuto stavu vyhnout.
Podle mých testů je v Googlu vyhledatelná i stránka, na kterou nevede žádný odkaz, ale je v
sitemap.xml
, u Seznamu ne.
Co to je sitemap.xml
?
Mapa webu je XML soubor obsahující primárně adresy jednotlivých stránek. Kromě URL jde uvést i další věci jako datum poslední úpravy, prioritu stránky nebo frekvenci četnosti změn.
Zpravidla se mapa webu nachází na adrese:
example.com/sitemap.xml
Ale není to podmínkou.
Příklad sitemapy
Příklad jedné <url>
položky v mapě webu (všechny adresy se vkládají do nadřazené značky <urlset>
):
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://jecas.cz/sitemap</loc>
<lastmod>2015-12-26T08:10:11+00:00</lastmod>
<changefreq>always</changefreq>
<priority>1.0</priority>
</url>
</urlset>
Musí se jmenovat sitemap.xml
?
XML soubor s mapou webu může mít libovolné jméno nebo příponu. Používat sitemap.xml
je jen zažitá konvence.
Mapu webu je klidně možné dynamicky generovat v PHP a podobně – většinou se tak i děje, protože sestavovat stovky nebo tisíce položek ručně není reálné. Jen je potřeba souboru přidat hlavičku Content-Type: application/xml
.
Je-li získání všech stránek časově náročné, je lepší mapu webu generovat do statického souboru při každé změně (přidávání/odebírání/upravování stránek).
Maximální velikost mapy webu
Podle specifikace je omezení velikosti mapy webu následující:
- Maximálně 50 000 URL.
- Datová velikost do 10 MB před gzip kompresí. Google má datový limit 50 MB.
Sitemap index
Pokud jeden nebo oba limity nestačí, je potřeba seznam adresy rozdělit do více souborů.
K tomu slouží tzv. sitemapindex. Do souboru sitemap.xml
se neuvedou URL stránek ale odkazy na dílčí mapy webu. Ty jde různě rozdělit třeba podle měsíců:
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>
http://example.com/sitemap-2015-12.xml
</loc>
</sitemap>
</sitemapindex>
Odkazovaný soubor sitemap-2015-12.xml
už potom obsahuje odkazy na stránky webu.
Sitemap index se může pro jistotu používat i pro menší počty URL.
Sitemapa v robots.txt
Soubor robots.txt
umožňuje předat pokyny robotům vyhledávačů, jde do něj i umístit odkaz na mapu webu:
Sitemap: http://example.com/sitemap.xml
Vytvoření sitemapy ve Wordpressu
Pro redakční systém WordPress existuje plugin Google XML Sitemaps. Stránky v mapě webu rozděluje po měsících, dokáže po přidání nebo úpravě článku dát vědět Google nebo Bingu o změně. Zároveň přidává odkaz na sitemap do robots.txt
.
- Google XML Sitemaps – stránka pluginu na Wordpress.org
Přidat sitemap na Seznam
Seznam nenabízí žádný formulář pro vložení/načtení sitemapy jako existuje třeba pro ruční přidání URL. Jediná možnost, jak ho informovat o vytvoření mapy webu, je uvést tuto informaci v souboru robots.txt
:
Slouží k tomu prosté:
Sitemap: http://example.com/sitemap.xml
Doporučení ohledně používání mapy webu na Seznamu:
- Seznam.cz nápověda: Sitemaps
Google má formulář pro nahrání mapy webu ve své službě pro webmastery Search Console.
V Procházení → Soubory Sitemap je vpravo nahoře tlačítko Přidat/otestovat soubor sitemap:
- Google Search Console Help: Build a sitemap
Bing
Vyhledávač Bing má podobně jako Google nástroje pro webmastery.
Sitemapu jde přidat po vybrání webu v nabídce Konfigurace mého webu → Soubory Sitemaps:
Jiné využití sitemap.xml
Kromě vyhledávačů může mapa webu posloužit i nástrojům pro vytěžování obsahu stránek. V mapě webu mají kompletní seznam všech URL webu na zlatém podnose.
RSS vs. sitemap
Vyhledávače dokáží jako strojově čitelný zdroj obsahu použít i RSS/Atom exporty. Ty ale většinou kvůli úsporám přenášení dat obsahují pouze několik nejnovějších záznamů.
V sitemap.xml
bývá seznam všech stránek.
HTML mapa webu
Protože v XML souboru sitemap.xml
si lidský návštěvník moc nepočte, některé weby obsahují mapy webu i v HTML podobě pro lidi.
Při určitém počtu stránek a stromové struktuře to může být užitečné. U webu se stovkami stránek a nejasnou hierarchií je asi pohodlnější způsob navigace interní vyhledávání.
Odkazy jinam
- Sitemaps.org: Sitemaps XML format
- Wikipedie: Sitemap
Komentáře