O webu
Náhled stránky na Seznam.cz

Jelikož weby jsou v screenshot generátoru Seznamu snímány v rozlišení cca 700×550 pix 700×525 bodů, může se snadno stát, že automatický náhled nebude ideální (zobrazení zmenšené podoby stránky pro malá zařízení nebo překrytí reklamou) a nezbývá než tzv. Screenshotátor popostrčit.

Nové náhledy na Seznamu

Zatím pokusně na seznam.sk funguje nový styl hledání s většími náhledy. Ty pořizuje nový screen-shot generátor v rozlišení 1600×1200 pixelů (podle měření v Google Analytics).

User-agent: Mozilla/5.0 (compatible; Seznam screenshot-generator 2.1; +http://fulltext.sblog.cz/screenshot/)

Kromě toho ještě existuje mobilní varianta: Mozilla/5.0 (Linux; U; Android 4.1.2; cs-cz; Seznam screenshot-generator Build/Q3) AppleWebKit/534.30 (KHTML, like Gecko) Version/4.0 Mobile Safari/534.30

Změna náhledu

Někdy se může stát, že obrázkový robot zachytí stránku špatně. Například v momentě, kdy probíhá údržba nebo se stane nějaká chyba. Stejně tak při úpravách vzhledu může být žádoucí, aby se náhled změnil.

Přegenerování lze vyžádat přidáním URL.

Přidáním stránky docílíte také obnovení starého nebo neexistujícího náhledu stránky.

Detekce

Pro detekování obrázkového robota jde využít tyto údaje:

IP adresa77.75.77.123
Hlavička user-agentMozilla/5.0 (compatible; Seznam screenshot-generator 2.0; +http://fulltext.sblog.cz/screenshot/)

Poznámka: IP adresa i user-agent se mohou změnit, aktuální hodnoty by měly být na stránce nápovědy Seznamu. Doporučuji testovat řetězec Seznam screenshot-generator, ten by snad mohl vydržet nejdéle.

Úpravy

Pro upravení náhledu lze zvolit dvě možnosti:

  1. některé části (typicky reklamy) při návštěvě generátorem screenshotů skrýt/upravit,
  2. ze stránky si udělat vlastní obrázek ve zmíněném rozlišení (cca 700×525 pix) a robotovi jej nabídnout jako <img> obrázek.

Řešení v PHP

V jazyce PHP potom stačí jednoduchá podmínka na začátku webu:

<?php 
if (strpos($_SERVER['HTTP_USER_AGENT'], "Seznam screenshot-generator")) {
  die("<img src='adresa-nahledoveho-obrazku.png'>");
}
?>

Nebo naopak:

<?php if (!strpos($_SERVER['HTTP_USER_AGENT'], "Seznam screenshot-generator")) { ?>
<div class='reklama'>Nějaký obsah, co se screenovacímu robotovi neukáže.</div>
<?php } ?>

Pokud je cílem skrýt některé prvky. V tomto případě dávám k úvaze jen přiřadit zvláštní CSS třídu pro <html> nebo <body> a potřebné změny zajistit pomocí CSS.

Cloaking?

Cloaking je podvodná technika, kdy se vyhledávačům (právě pomocí nějaké detekce jako je výše uvedená) a běžným návštěvníkům posílá různý obsah s nekalým úmyslem vyhledávač obelstít (více na anglické Wikipedii).

Nicméně při nepodovodném použití se jedná o běžný content negotiation, tj. čistou praktiku podobně jako mobilní prohlížeče dostávají upravenou mobilní versi a slušný vyhledávač by neměl nic namítat.

Hlavní obrázek

Ohledně náhledů Seznam.cz nabízí ještě tzv. Hlavní obrázek, ten ale bohužel není moc použitelný.

Hlavní obrázek (previewimage) se uplatňuje jenom v několika spíše výjimečných situacích. V případě normální stránky pouze při hledání přes operátor site:.

Yuhů na DJPW