Duplicitní obsah ve zkratce

Duplicitní obsah odkazuje na velmi podobný nebo úplně stejný obsah na několika stránkách. Mějte na paměti, že:

  • Duplicitní obsah má pro vaše návštěvníky malou hodnotu a zbytečně mate vyhledávače.
  • Je třeba se vyhnout duplicitnímu obsahu, protože může poškodit váš SEO výkon.
  • Duplicitní obsah může být způsoben technickými nehodami nebo ručně zkopírovaným obsahem.
  • Existují účinné způsoby, jak zabránit tomu, aby se tyto případy duplicitního obsahu staly problémy, o kterých hovoříme v tomto článku.

Co je to duplicitní obsah?

Zjednodušeně řečeno, duplicitní obsah znamená velmi podobný nebo přesně ten samý obsah, který se nachází na více stránkách vašeho webu nebo mimo něj.

V širším kontextu je duplicitní obsah takový, který přináší vašim zákazníkům pouze malou nebo žádnou hodnotu. To také znamená, že stránky, které mají malý nebo dokonce žádný obsah, jsou také považovány za duplicitní obsah.

Duplicitnímu obsahu byste se měli vyhnout, protože je matoucí i pro samotné vyhledávače a může snížit váš SEO výkon.

Roboti vyhledávačů jsou z duplicitního obsahu zmateni.
Roboti vyhledávačů jsou z duplicitního obsahu zmateni.

Proč je duplicitní obsah špatný pro SEO?

Duplicitní obsah je špatný hlavně ze dvou důvodů:

  1. Ve chvíli, kdy máte dostupných hned několik verzí obsahu, je pro vyhledávač obtížné rozhodnout se, kterou verzi zaindexovat a následně ji zobrazit ve výsledcích vyhledávání. Toto poté snižuje celkový výkon pro všechny verze tohoto obsahu. A to z důvodu, že tyto verze spolu navzájem soupeří.
  2. Vyhledávače boudou mít problém se stanovením metrik odkazů (autorita, relevance a důvěra) pro tento obsah. Zejména, když ostatní webové stránky budou odkazovat na více než jednu verzi tohoto obsahu.

Co o duplicitním obsahu říkají specialisté?

Duplicita je jeden z nejrozšířenějších problémů v SEO vůbec. Panuje kolem něj ale spousta mýtů a polopravd. Nejlepší řešení na duplicitní obsah je takový vůbec nevytvářet, myslete na to, když tvoříte web."

Má váš web problémy s duplicitním obsahem?

Duplicitní obsah může mít negativní vliv na výkon vašeho SEO.
Proč tedy nezkontrolovat, zda kvůli němu váš web zbytečně netrpí?

Vložte platnou doménu, prosím (www.priklad.cz).

Je duplicitní obsah penalizován?

Mít duplicitní obsah může poškodit váš SEO výkon, ale samotný Google vás penalizovat nebude do té doby, dokud nebudete úmyslně kopírovat obsah z cizích webových stránek. Pokud se řadíte mezi "poctivé" majitele webových stránek s tímto typem technického problému a nesnažíte se Google nějak oklamat, nemusíte se obávat, že by vás od něj nějaká penalizace čekala.

Pokud jste ale zkopírovali větší množství obsahu, pak se pohybujete na tenkém ledě. Podívejte se, co o tom říká samotný Google:

“Duplicitní obsah na stránkách není důvodem k opatřením vůči dotyčným stránkám, pokud se duplicitní obsah nejeví tak, že jeho záměrem je podvod a manipulace s výsledky vyhledávačů. Pokud vaše stránky trpí problémem s duplicitním obsahem a vy nebudete postupovat podle rad uvedených výše, budeme se snažit co nejlépe vybrat, kterou verzi obsahu zobrazíme ve výsledcích vyhledávání.”

Běžné příčiny duplicitního obsahu

Duplicitní obsah je často způsoben nesprávným nastavením webového serveru nebo webových stránek. Tyto případy jsou technické povahy a pravděpodobně nikdy nebudou mít za následek penalizaci od Googlu. Mohou však vážně poškodit vaše hodnocení a proto je důležité, aby bylo vaší prioritou je opravit.

Kromě technických příčin existují také ty lidské: obsah je záměrně kopírován a publikován jinde. Jak jsme již zmínili - pokud se jedná o zlý úmysl, může zde přijít trest v podobě penalizace.

Duplicitní obsah z technických důvodů

Www vs. bez www a HTTP vs. HTTPse
Řekněme, že používáte subdoménu www a protokol HTTPs. Pak preferujete poskytování obsahu přes https://www.priklad.cz. To je vaše kanonická doména.

Pokud je váš web špatně nastaven, váš obsah může být také dosažitelný přes:

Duplicitní obsah v důsledku různých kanonických domén.
Duplicitní obsah v důsledku různých kanonických domén.

Vyberte vámi preferovanou cestu, kterou váš obsah doručíte, a nastavte přesměrování s kódem 301 pro ostatní cesty, které k ní povedou: https://www.priklad.cz.

Struktura URL: velká písmena a koncová lomítka
Adresy URL rozlišují velká a malá písmena, což znamená, že  https://priklad.cz/url-a/ a https://priklad.cz/url-A/  jsou považovány za různé URL adresy. Při vytváření odkazů je pak snadné udělat překlep, který způsobí, že obě verze URL budou indexovány.

Lomítko (/) na konci URL se nazývá koncové lomítko. Často jsou adresy URL přístupné skrze obě tyto varianty:  https://priklad.cz/url-a a také https://priklad.cz/url-a/.

Duplicitní obsah kvůli rozdílu ve velikosti písmen v URL a použití lomítka.
Duplicitní obsah kvůli rozdílu ve velikosti písmen v URL a použití lomítka.

Zvolte preferovanou strukturu pro vaše URL adresy a pro ostatní verze nastavte přesměrování 301 na preferovanou verzi URL.

Indexové stránky (index.html, index.php)
Bez vašeho vědomí může být vaše domovská stránka přístupná prostřednictvím více adres URL, protože váš webový server je nesprávně nakonfigurován. Kromě https://www.priklad.cz může být vaše domovská stránka také přístupná prostřednictvím:

  • https://www.priklad.cz/index.html
  • https://www.priklad.cz/index.asp
  • https://www.priklad.cz/index.aspx
  • https://www.priklad.cz/index.php

Opět vyberte preferovanou cestu přístupu na vaši domovskou stránku a nastavte přesměrování 301 na preferovanou verzi.

Parametry pro filtrování
Webové stránky často v adresách URL využívají parametry, takže mohou nabídnout funkci filtrování. Ukažme si to na příkladu této URL adresy:

https://www.priklad.cz/hracky/auta?barva=cerna

Tato stránka by měla zobrazit všechny položky, které splňují tyto podmínky (hračky, auta, černá). Tedy všechna černá autíčka.

Zatímco toto je skvělé pro návštěvníky, může to být závažným problémem pro vyhledávače. Možnosti filtrování často generují prakticky nekonečné množství kombinací, pokud je k dispozici možnost více než jednoho filtru. A o to více, že parametry lze také přeskupit.

Tyto dvě URL adresy by měly ukázat tentýž obsah:

Duplicitní obsah z důvodu odlišného pořadí parametrů URL.
Duplicitní obsah z důvodu odlišného pořadí parametrů URL.

Implementujte kanonické adresy URL - jednu pro každou hlavní nefiltrovanou stránku - zabráníte tak duplicitnímu obsahu a upevníte autoritu stránky poskytované filtrem.

Taxonomie
Taxonomie je seskupovací mechanismus pro klasifikaci obsahu. Často se používají v systémech správy obsahu (Content Management Systems) pro podporu kategorií a tagů.

Řekněme, že máte blogový příspěvek ve třech kategoriích. Příspěvek může být přístupný všemi třemi způsoby:

  • https://www.priklad.cz/kategorie-a/tema/
  • https://www.priklad.cz/kategorie-b/tema/
  • https://www.priklad.cz/kategorie-c/tema/
Duplicitní obsah způsobený stránkami, které se nacházejí ve více kategoriích.
Duplicitní obsah způsobený stránkami, které se nacházejí ve více kategoriích.

Jednu kategorii zvolte jako primární a na ostatní přidejte kanonická URL směřující na tuto primární kategorii.

Stránky vyhrazené pro obrázky
Některé systémy pro správu obsahu vytvářejí samostatnou stránku pro každý obrázek. Taková stránka často ukazuje pouze obrázek na jinak prázdné stránce. Vzhledem k tomu, že tato stránka nemá jiný obsah, je velmi podobná všem ostatním stránkám obrázků a tím vzniká duplicitní obsah.

Na těchto vyhrazených stránkách pro obrázky tedy implementujte kanonickou adresu URL, která ukazuje na stránku, ve které byl obrázek použit.

Stránky s komentáři
Pokud máte na vašem webu povolené komentáře, můžete je po určitém množství automaticky stránkovat. Stránkované komentáře zobrazí původní obsah stránek; pouze komentáře v dolní části se budou lišit.

Například URL stránky zobrazující komentáře 1-20 mohou být https://www.priklad.cz/kategorie/topic/, https://www.priklad.cz/kategorie/tema/komentare-2/ pro komentáře 21-40, a https://www.priklad.cz/kategorie/tema/komentare-3/ pro komentáře 41-60.

Použijte stránkování, aby bylo jasné, že se jedná o sekvenci stránek.

Lokalizace
Když přijde řeč na lokalizaci, může dojít k problémům s duplicitním obsahem, pokud používáte přesně stejný obsah k cílení na lidi v různých regionech, kteří mluví stejným jazykem. Například: když máte specializovaný web pro kanadský trh a také pro americký trh - oba v angličtině - je velká šance, že zde je hodně duplicitního obsahu.

Použitím atributu hreflang signalizujeme, že tyto lokalizované stránky jsou určené pro odlišné publikum.

Indexovatelné stránky vyhledávání
Mnoho webů umožňuje vyhledávání přímo na webových stránkách. Stránky, na kterých jsou zobrazeny výsledky vyhledávání, jsou velmi podobné a ve většině případů neposkytují vyhledávačům žádnou hodnotu. Právě proto byste neměli chtít, aby byly pro vyhledávače indexovatelné.

Zabraňte vyhledávačům indexovat stránky výsledků vyhledávání použitím atributu meta tag robots noindex. Obecně se považuje také za nejlepší, když nebudete odkazovat na stránky s výsledky vyhledávání.

Indexovatelné vývojové/testovací prostředí
Stejně tak je osvědčenou praxí používat vývojové prostředí pro uvádění a testování nových funkcí na webových stránkách. Ale ty jsou často nesprávně nechané přístupné a indexovatelné pro vyhledávače.

Duplicitní obsah kvůli veřejně přístupným testovacím stránkám.
Duplicitní obsah kvůli veřejně přístupným testovacím stránkám.

Používejte HTTP ověřování, abyste zabránili přístupu do vývojového a testovacího prostředí. Další výhodou je, že tím také zabraňujete, aby k nim měli přístup nesprávní lidé.

Vyhněte se publikování obsahu, na kterém se zrovna pracuje 
Když tvoříte novou stránku, která obsahuje menší množství textu, ukládejte ji bez toho, aniž byste ji publikovali - ve většině případů tato stránka nemá žádnou hodnotu.
Nedokončené věci ukládejte pouze jako "pracovní verze". A pokud už potřebujete publikovat stránku, která obsahuje jen omezené množství obsahu, zabraňte vyhledávačům, aby ji indexovali: použijte atribut meta tag robots noindex.

Parametry používané pro sledování
Parametry se běžně používají také pro sledování (tracking). Například při sdílení URL adres na Twitteru je zdroj přidán do adresy URL. Toto je další zdroj duplicitního obsahu. Vezměte si například tuto adresu URL, která byla na tweetována pomocí vyrovnávací paměti (Bufferu):

https://www.contentkingapp.com/academy/ecommerce-link-building/?utm_content=buffer825f4&utm_medium=social&utm_source=twitter.com&utm_campaign=buffer

Osvědčená praxe je implementovat kanonická URL, která odkazují samy na sebe. Pokud jste to již udělali, problém je vyřešen. Všechny URL adresy s těmito sledovacími parametry jsou upravené na svoji kanonickou URL bez parametrů.

ID relace
Návštěvnické relace mohou ukládat informace o návštěvnících pro webovou analytiku. Pokud ale každý návštěvnický poždavek na URL obdrží přidělené ID relace, vytvoří to spoustu duplicitního obsahu, protože obsah těchto URL adres je naprosto stejný.

Například, pokud se u nás prokliknete na lokalizovanou verzi našeho webu, přidáme proměnnou do relace Google Analytics jako https://www.contentking.cz/?_ga=2.41368868.703611965.1506241071-1067501800.1494424269. Toto zobrazí domovskou stránku s tím samým obsahem, ale na odlišné URL adrese.

Tedy ještě jednou - osvědčenou praxí je implementovat kanonickou URL adresy, které odkazují samy na sebe. Pokud jste to již udělali, problém je vyřešen. Všechny URL adresy s těmito sledovacími parametry jsou upravené na svoji kanonickou URL bez parametrů.

Verze pro tisk
Když mají stránky svoji verzi pro tisk na samostatné URL, jsou zde přirozeně dvě verze toho samého obsahu. Představte si toto https://www.priklad.cz/nejaka-stranka/ a https://www.priklad.cz/print/nejaka-stranka/.

Implementujte kanonickou URL vedoucí z verze pro tisk na normální verzi stránky.

Duplicitní obsah způsobený kopírováním

Cílové stránky pro placené vyhledávání
Placené vyhledávání vyžaduje mít připraveny vyhrazené vstupní stránky (landing pages) zaměřené na konkrétní klíčová slova. Landing pages jsou často kopie původních stránek, které jsou pak upraveny tak, aby cílily na konkrétní klíčová slova. Vzhledem k tomu, že tyto stránky jsou velmi podobné, tak samozřejmě (v případě, že jsou indexovány) vytvářejí duplicitní obsah.

Duplicitní obsah způsobený drobnými rozdíly mezi cílovými stránkami.
Duplicitní obsah způsobený drobnými rozdíly mezi cílovými stránkami.

Zabraňte vyhledávačům indexovat tyto cílové stránky implementací atributu meta tagu robots noindex. Obecně je pak nejlepší na ně neodkazovat a ani je nezařazovat do souboru sitemap XML.

Když ostatní kopírují váš obsah
Duplicitní obsah může také pocházet z toho, že ostatní kopírují obsah a publikují ho jinde. To je obzvláště problém, pokud vaše webové stránky mají nízkou autoritu domény a ten, který kopíruje obsah, má autoritu vyšší. Kopírující pak může být vnímám vyhledávačem jako původní autor a zlepšit si hodnocení na váš účet.

Ujistěte se, že ostatní webové stránky na vaši stránku odkazují a zároveň používají kanonické URL vedoucí na tuto stránku. Pokud to nebudou ochotni udělat, vždy můžete odeslat DMCA žádost pro odebrání obsahu z Google  anebo podniknout příslušné právní kroky.

Hledání duplicitního obsahu

Hledání duplicitního obsahu na vašich stránkách

Pomocí aplikace ContentKing můžete snadno najít duplicitní obsah, a to tak, že zkontrolujete, zda mají stránky jedinečný název stránkymeta description a nadpis H1. To můžete provést v sekci Problémy a otevřením karet "Meta informace" a "Nadpisy". Zjistěte, zda existují nějaké nevyřešené problémy typu:

  • “Název stránky není jedinečný”
  • “Meta popis není jedinečný”
  • “H1 nadpis není jedinečný”

Otestujte svůj web na duplicitní obsah

S ContentKingem můžete snadno zjistit, jestli váš web netrpí problémy s duplicitním obsahem. Kontrola může začít během 20 vteřin.

Vložte platnou doménu, prosím (www.priklad.cz).

Hledání duplicitního obsahu na ostatních webech

Pokud máte menší web, můžete zkusit vyhledávání fráze na Google v uvozovkách. Pokud například chci zjistit, zda existují nějaké další verze daného článku, mohu hledat "Pomocí aplikace ContentKing můžete snadno najít duplicitní obsah, a to tak, že zkontrolujete, zda mají stránky jedinečný název stránky, meta popis a nadpis H1. "

Alternativou pro větší weby je využití služeb jako Copyspace. Copyscape prochází web a hledá více výskytů stejného nebo téměř stejného obsahu.

Často kladené dotazy ohledně duplicitního obsahu

  1. Mohu dostat trest za duplicitní obsah?
  2. Zvýší odstranění problémů s duplicitami hodnocení webu?
  3. Jaké množství duplicitního obsahu je ještě přijatelné?

1. Mohu dostat trest za duplicitní obsah?

Pokud jste úmyslně nekopírovali některou webovou stránku, je velmi nepravděpodobné, že byste obdrželi penalizaci za duplicitní obsah.

Pokud jste ale zkopírovali větší množství obsahu, pak se pohybujete na tenkém ledě. Podívejte se, co o tom říká samotný Google:

“Duplicitní obsah na stránkách není důvodem k opatřením vůči dotyčným stránkám, pokud se duplicitní obsah nejeví tak, že jeho záměrem je podvod a manipulace s výsledky vyhledávačů. Pokud vaše stránky trpí problémem s duplicitním obsahem a vy nebudete postupovat podle rad uvedených výše, budeme se snažit co nejlépe vybrat, kterou verzi obsahu zobrazíme ve výsledcích vyhledávání.”

2. Zvýší odstranění problémů s duplicitami hodnocení webu?

Ano, tím, že vyřešíte problémy s duplicitním s obsahem, řeknete vyhledávačům, které stránky by měly skutečně procházet, indexovat a hodnotit.

Zabráníte tím také, aby vyhledávače zbytečně vypotřebovávaly tzv. crawl budget pro váš web na duplicitních stránkách. Mohou se místo toho zaměřit na jedinečný obsah na vašem webu, který skutečně chcete hodnotit.

3. Jaké množství duplicitního obsahu je ještě přijatelné?

Na tuhle otázku neexistuje pouze jedna správná odpověď. Každopádně: pokud chcete pro stránku dobré hodnocení, musí být pro vaše návštěvníky zajímavá a nabídnout jim jedinečný obsah.

Zjistěte více o duplicitním obsahu

Pokud si chcete přečíst další užitečné informace v oblasti duplicitního obsahu, doporučujeme podívat se na následující zdroje:

Získejte zkušební verzi na 14 dní zdarma

Začněte během 20 vteřin

Vložte platnou doménu, prosím (www.priklad.cz).
  • Platební karta není potřeba
  • Není třeba žádná instalace
  • Bez závazků