Co to je kanonické URL?

rel=”canonical”, často nazývané jako kanonické URL, je HTML prvek pomáhající předcházet problémům s duplicitním obsahem. V případě, že existuje více stejných nebo podobných dokumentů, sděluje vyhledávačům, kterou verzi dokumentu by měly preferovat. Pokud má stránka A kanonický odkaz na stránku B, znamená to, že stránka B je kanonická.

Kanonizace je proces, při kterém se z mnoha verzí jedné stránky vybere jedna hlavní.

Synonyma pro kanonické URL

Kanonické URL se často označuje také jako kanonický tag, kanonický odkaz, rel canonical nebo rel="canonical". Pro lepší přehlednost v tomto článku používáme pouze označení kanonické URL.

Co je cílem tohoto článku

Tento článek vysvětluje, kdy a jakým způsobem efektivně používat kanonická URL tak, aby byli návštěvníci vašeho webu spokojení a vyhledávače nenarážely na problémy s indexací. Projdeme osvědčené postupy i často kladené otázky.

K čemu potřebujete kanonická URL?

Pomocí kanonických URL můžete předcházet problémům s duplicitním obsahem, a to jak interně, tak externě. Interní duplicitní obsah se vyskytuje v rámci vašeho webu. K externímu duplicitnímu obsahu dochází, pokud se vyskytují stejné nebo velmi podobné stránky na různých doménách..

Kanonická URL sdělují Googlu, Bingu a Yahoo, které stránky mají ve výsledcích vyhledávání zobrazit a které skrýt. I když se vyhledávače mohou rozhodnout kanonická URL ignorovat, přesto vám, jak vlastníkovi webu, umožňují získat větší kontrolu nad online zobrazením vašich stránek.

Jak kanonická URL vypadají?

Uživatelé při návštěvě vašeho webu kanonická URL neuvidí. Nastavují se buď ve zdrojovém kódu stránky nebo v HTTP hlavičce.

Zdrojový kód stránky

Kanonické URL by mělo být umístěno v sekci <HEAD> zdrojového kódu. Jako příklad si můžeme vzít naši domovskou stránku:

<HTML>
<HEAD>
<link rel=“canonical“ href=“https://www.contentkingapp.com/“ />
</HEAD>

HTTP hlavička

V HTTP hlavičce se kanonické URL obvykle nastavuje pro dokumenty v jiných formátech než HTML (například PDF).

Vypadá to následovně:

HTTP/1.1 200 OK
Server: nginx
Date: Thu, 28 Apr 2016 11:54:25 GMT
Content-Type: application/pdf
Content-Length: 23629
Last-Modified: Fri, 29 Apr 2016 17:47:17 GMT
Link: <http://www.priklad.cz/downloads/whitepaper.pdf>;
rel=“canonical“

Jedna z možných situací, kdy byste mohli potřebovat nastavit kanonické URL v HTTP hlavičce pro jiný dokument než HTML je, pokud máte daný obsah jak ve formě běžné stránky (HTML dokument), tak ve fromě PDF souboru.

Důležité: v současnosti podporuje nastavování kanonických URL pomocí HTTP hlavičky pouze Google. Neplatí to ale pro obrázky.

Kdy použít kanonické URL?

Neexistuje situace, kdy by nebylo vhodné použít kanonické URL. Google, Bing a Yahoo se na ně spoléhají při rozhodování, kterou stránku zobrazit ve výsledcích vyhledávání. Kanonické URL může odkazovat buď samo na sebe nebo na nějakou jinou stránku.

Kanonické URL odkazující samo na sebe

Pokud existuje pouze jediná verze dané stránky, kanonické URL musí odkazovat na tuto stránku, tedy na sebe.

V podstatě tím říká vyhledávačům: “Existuje pouze jediná verze této stránky a tu je třeba indexovat.”

Kanonické URL odkazující na jinou stránku

Pokud existuje více verzí jedné stránky, zajistěte, aby kanonické URL odkazovalo na tu verzi, kterou mají vyhledávače indexovat.

Běžné případy, kdy kanonická URL vyřeší problém s duplicitním obsahem:

  • Pokud jsou kritéria vyhledávacího dotazu použita v URL.
  • Pokud se stránky liší jen nepatrně, což se běžně označuje jako blízké duplikáty.
  • Pokud bylo záměrně vytvořeno více verzí jedné stránky.

Kritéria vyhledávacího dotazu v URL

V závislosti na URL struktuře webu mohou URL občas obsahovat kritéria vyhledávacího dotazu.

Vezměmě si například:

www.example.com/shoes/nike?lang=uk&id=101

  • Proměnná lang=uk říká, že jazyk požadované stránky je angličtina (UK).
  • Proměnná id=101 říká, že číslo požadované stránky je 101.
  • Mezi proměnnými je znak &, který namená, že chceme stránku 101 v britské angličtině.

Zatímco kritéria vyhledávacího dotazu jsou praktická, URL obsahující tato kritéria jsou dost nesrozumitelná a snadno mohou být příčinou duplicitního obsahu. www.example.com/shoes/nike?id=101&lang=uk posílá požadavek na tutéž stránku jako www.example.com/shoes/nike?lang=uk&id=101, ale tyto stránky mají odlišná URL. Tento typ duplicitního obsahu se dá snadno opravit pomocí kanonického URL.

Nepatrně odlišné stránky (blízké duplikáty)

Pokud se stránky liší pouze nepatrně, nazýváme je ‘blízké duplikáty’. Dobrým příkladem takových stránek jsou komerční weby prodávající boty. Představte si boty Nike Air Max v čísle 38 dostupné v červené, modré a černé barvě. Pokud v požadavku změníte barvu, URL se změní také, ale 99% obsahu stránky zůstává beze změn.

  • General Nike Air Max číslo 38: www.example.com/shoes/nike/men-38/
  • General Nike Air Max číslo 38 v červené: www.example.com/shoes/nike/men-38-red/
  • General Nike Air Max číslo 38 v modré: www.example.com/shoes/nike/men-38-blue/
  • General Nike Air Max číslo 38 v černé: www.example.com/shoes/nike/men-38-black/

Jelikož je obsah těchto čtyř stránek velmi podobný, je dobré mít nastaveno kanonické URL na www.example.com/shoes/nike/men-38-red/, www.example.com/shoes/nike/men-38-blue/www.example.com/shoes/nike/men-38-black/ odkazující na www.example.com/shoes/nike/men-38/.

Více záměrných verzí jedné stránky

Může existovat mnoho důvodů pro záměrné vytvoření více verzí jedné stránky. Uveďme si dva příklady:

  1. Personalizované cílové stránky kampaní
  2. Při testování optimalizace konverzního poměru, kdy testujete tři verze jedné stránky v podstatě se stejným obsahem.

Pokud existuje více verzí jedné stránky, zajistěte, aby kanonický odkaz vedl na jednu hlavní verzi této stránky, která má být indexována. Pokud kanonický odkaz vede na jinou stránku než na tu, na které se nalézá, říká tím vyhledávačům:

“Tato stránka má více verzí, které jsou buď shodné nebo velmi podobné. Aby váš index zůstal přehledný, indexujte pouze stránku, na kterou odkazuji.”

Odlišné stránky pro počítače a pro mobily

Pokud máte odlišné stránky pro počítače a pro mobily, měli byste používat kanonické URL a alternativní URL, a tak sdělit vyhledávačům, jaký je vztah mezi těmito stránkami. V současnosti to ovšem podporuje pouze Google.

Počítač

Kanonické URL a alternativní URL v sekci <HEAD> na stránce určené pro počítače:

<HTML>
<HEAD>
<link rel=“canonical“ href=“https://www.priklad.cz/“ />
<link rel=“alternate“ href=“https://m.priklad.cz/“ />
</HEAD>

Mobil

Kanonické URL v sekci <HEAD> na stránce určené pro mobily:

<HTML>
<HEAD>
<link rel=“canonical“ href=“https://www.priklad.cz/“ />
</HEAD>

Tímto způsobem pak vyhledávače zobrazí odpovídající verzi stránky pro mobilní telefony a odpovídající verzi pro počítače.

Cross-domain kanonické URL

Kanonické URL může zabránit problémům s duplicitním obsahem v případech, kdy se tyto problémy týkají více než jedné stránky. Pokud je obsah uveřejněn na několika doménách, je možné použít cross-domain kanonické URL sdělující vyhledávačům, kterou verzi stránky by měly indexovat.

Sloučení nepotřebných stránek pomocí přesměrování

Pokud není nezbytné, aby bylo k dispozici více verzí jedné stránky, nejlepším řešením je přesměrovat tyto nepotřebné stránky na jednu hlavní verzi. Tady je několik příkladů, kdy je přesměrování nejlepším řešením pro více verzí jedné stránky:

  • Pokud je stránka dostupná jak přes HTTP protokol, tak přes HTTPS.
  • Pokud je stránka dostupná na více doménách (www.priklad1.cz, www.priklad2.cz, www.priklad3.cz) nebo subdoménách (www.priklad.cz, www2.priklad.cz, www3.priklad.cz) a neslouží to žádnému účelu.

Měli byste vědět, že i když použijete v právě zmíněných příkladech přesměrování, je vhodné použít také kanonická URL. Pokud vaše přesměrování přestanou fungovat, stále máte kanonická URL, která by měla předejít problémům s duplicitním obsahem.

Jaké jsou osvědčené postupy pro kanonická URL?

Kanonická URL jsou pro webmastery velmi mocným nástrojem. Při práci s nimi je důležité se řídit následujícími osvědčenými postupy, abyste tak předešli problémům s indexací:

  • Používejte absolutní URL – o stránce, kterou mají vyhledávače indexovat, nesmí existovat žádné pochyby. Používejte kompletní URL včetně protokolu (HTTP nebo HTTPS), subdomény a domény.
  • Každá stránka by měla mít právě jedno kanonické URL
  • Umístěte ho do sekce <HEAD> nebo do HTTP hlavičky
  • Odkazujte na indexovatelnou stránku – kanonické URL by mělo vždy odkazovat na indexovatelnou stránku.
  • Do XML sitemap začleňte pouze jednu hlavní verzi stránky

Používejte absolutní URL

Pro kanonické URL by se mělo používat pouze absolutní URL. Tady je příklad:

<link rel=“canonical“ href=“https://www.priklad.cz/sluzby/opravy/“>

Pokud toto URL použijeme jako kanonické, nemohou nastat žádné pochybnosti o jeho umístění:

Teď srovnejme toto URL s následujícím, ne příliš jasným URL:

<link rel=“canonical“ href=“opravy/“>

Některé webové servery jsou už v základním nastavení špatně nakonfigurované, takže vaše stránka bude dostupná přes všechny domény i subdomény. To způsobí obrovské množství duplicitního obsahu, kterému byste se měli vždy vyvarovat.

Pokud použijete pro kanonické URL absolutní URL, předejdete tak těmto problémům s duplicitním obsahem.

Každá stránka by měla mít právě jedno kanonické URL

Každá stránka by měla mít právě jedno kanonické URL. Pokud jich má více, může to zmást vyhledávače. Google oznámil, že bude kompletně ignorovat všechna kanonická URL, pokud bude mít stránka více než jedno. Bing a Yahoo také doporučují používat pro každou stránku vždy pouze jedno kanonické URL, není nám ovšem známo, jak postupují v případech, kdy jich má stránka víc.

Umístěte kanonické URL do sekce <HEAD>

Kanonické URL by mělo být vždy umístěno v sekci <HEAD>. Pokud tomu tak není, vyhledávače ho nebudou schopny najít a zpracovat. V důsledku to může způsobit problémy s duplicitním obsahem.

Odkazujte na indexovatelnou stránku

Kanonické URL by mělo vždy odkazovat na indexovatelnou stránku. Pokud odkazuje na stránku s přesměrováním 301 nebo na stránku, která má sama kanonický odkaz vedoucí někam jinam, může to zmást vyhledávače.

Do XML sitemap začleňte pouze jednu hlavní verzi stránky

Vaše XML sitemap by měla zahrnovat pouze stránky indexovatelné pro vyhledávače. V případě, že máte více verzí jedné stránky, je důležité zahrnout do XML sitemap pouze hlavní verzi této stránky.

Kde jsou limity kanonického URL?

Přestože jsou kanonická URL výbornými nástroji pro každého webmastera, mají také svá omezení.

Pouze částečný přenos autority odkazů

Podívejme se na příklad: stránka A má několik skutečně významných zpětných odkazů. Tato stránka má kanonický odkaz na stránku B. Vyhledávače budou s nějvětší pravděpodobností indexovat stránku B, zatímco stránku A nechají být.

Každý odkaz stránce přináší určitou autoritu, která se nazývá autorita odkazu. Autorita odkazů, kterou získává stránka A, se přenáší pouze částečně na stránku B. Pouze částečně jsme dali do kurzívy, protože jde o oblast, o které se vyhledávače moc nezmiňují. Neexistuje výzkum, který by dokazoval, že kanonické URL přenáší veškerou autoritu odkazu. Kromě toho, kanonický odkaz byl vytvořen, aby sděloval vyhledávačům, které stránky mají zobrazovat, ne aby přenášel veškerou autoritu odkazu.

Matt Cutts z Googlu prohlásil, že: “mezi nimi neexistuje žádný velký rozdíl [mezi kanonickým URL a přesměrováním 301]”.

Pokud chcete přenést co nejvíce autority odkazu, doporučujeme použít přesměrování 301.

Kanonická URL neřeší problémy s procházením webu vyhledávači

Kanonická URL mají řešit problémy s duplicitním obsahem. Říkají vyhledávačům, které stránky mají indexovat, ne které stránky mají procházet. Je třeba to rozlišovat.

Pokud vyhledávače netráví čas procházením užitečných a důležitých stránek, pak máme problém. Existuje mnoho důvodů, proč k tomu dochází. Je možné, že se roboti vyhledávačů dostali do nekonečné smyčky přesměrování, tráví mnoho času procházením stránek, které nechcete nutně indexovat, nebo naráží na slepé uličky vašeho webu (stránky, ze kterých nevedou odkazy na další stránky). Vyhledávače tak zbytečně plýtvají časem. To je problém hlavně od té doby, co mají tzv. crawl budget (tedy omezený čas přidělený na procházení webu). Problémům s procházením webu vyhledávači můžete předejít použitím souboru robots.txt.

Často kladené otázky ohledně kanonických URL

  1. Přenášejí kanonická URL nějakou autoritu odkazů?
  2. Mohu nějak přimět vyhledávače použít mé kanonické URL?
  3. Je kanonické URL lepší než přesměrování 301?
  4. Mohu svůj web přeplnit kanonickými URL?
  5. Kanonická URL jsou podporována všemi vyhledávači?
  6. Jak se vyhledávače chovají, pokud má stránka více než jedno kanonické URL?
  7. Brání kanonická URL vyhledávačům procházet stránky?
  8. Měl bych používat kanonická URL i v případě paginace?

1. Přenášejí kanonická URL nějakou autoritu odkazů?

Předpokládáme, že nějaká autorita se při kanonizaci URL přenáší.

Jak píšeme v sekci Pouze částečný přenos autority odkazů, nemůžeme tvrdit s naprostou jistotou, jestli kanonická URL přenáší autoritu odkazu nebo ne. Kanonická URL nebyla vytvořena s cílem přenášet autoritu odkazu. K tomuto účelu slouží přesměrování 301.

2. Mohu nějak přimět vyhledávače použít mé kanonické URL?

Ne, kanonické URL je pro vyhledávače spíše vodítko než příkaz.

3. Je kanonické URL lepší než přesměrování 301?

Kanonické URL a přesměrování 301 jsou dva naprosto odlišné prostředky.

Kanonické URL se používá, pokud mají být všechny verze jedné stránky přístupné návštěvníkům, ale pouze jedna z nich by měla být indexovatelná pro vyhledávače.

Přesměrování 301 převádí jak návštěvníky, tak vyhledávače z jednoho URL na jiné. Pro žádného z nich není přesměrované URL přístupné.

4. Mohu svůj web přeplnit kanonickými URL?

Pokud se používají nesprávně, mohou kanonická URL způsobit závažné problémy při indexaci vašich webových stránek.

Představte si například, že by z nějakého důvodu měly všechny stránky vašeho webu kanonické URL směřující na domovskou stránku. Protože jsou kanonická URL výrazným signálem pro vyhledávače, ty by s největší pravděpodobností přestaly tyto stránky indexovat.

I když je třeba být při používání kanonických URL opatrný, doporučujeme je používat, abyste tak dali vyhledávačům vědět, které stránky mají indexovat.

5. Kanonická URL jsou podporována všemi vyhledávači?

S jistotou víme, že Google, Bing i Yahoo kanonická URL podporují.

Zdá se, že i Yandex a Baidu je podporují. U DuckDuckGo to není jisté.

6. Jak se vyhledávače chovají, pokud má stránka více než jedno kanonické URL?

Google oznámil, že v takovém případě bude všechna kanonická URL ignorovat.

U ostatních vyhledávačů není jasné, jak s takovou situací nakládají, proto důrazně doporučujeme používat pro každou stránku pouze jedno kanonické URL.

7. Brání kanonická URL vyhledávačům procházet stránky?

Ne, nebrání. I když máte kanonická URL odkazující na jiné stránky než na sebe, vyhledávače prohledají i stránky, na které tato URL nevedou. Kanonická URL představují pro vyhledávače pouze signál, kterou stránku by měly zobrazit ve výsledcích vyhledávání. Viz také sekce: Kanonická URL neřeší problémy s procházením webu prohlížeči.

8. Měl bych používat kanonická URL i v případě paginace?

Obecně se doporučuje nepoužívat kanonická URL tam, kde máte paginaci. Stránky, na kterých je použita paginace, obvykle nezobrazují stejný obsah. Místo kanonických odkazů se doporučuje použít spíše rel="next" a rel="prev". To je lepší způsob, jak sdělit vyhledávačům, že tyto stránky tvoří sekvenci s logickým pořádkem.

Můžete použít kanonické URL i v případě paginace, ale pouze tehdy, pokud tam máte stránku ‚Zobrazit vše‘, která se rychle načítá. V takovém případě bude kanonické URL na všech stránkách odkazovat právě na stránku ‚Zobrazit vše‘. Podívejte se na: https://support.google.com/webmasters/answer/1663744?hl=cs

Jste připraveni vyzkoušet ContentKing?

Objevte, co se děje na vašem webu.
Vložte platnou doménu, prosím (www.priklad.cz).