Basta Digital logo

Duplicity škodia vašim pozíciám: Ako ich odstrániť?

6 min čítania
Andrej Tomić
SEO tím líder
Duplicity na webovej stránke sú jedným z faktorov, ktoré ovplyvňujú pozície kľúčových slov vo vyhľadávaní. Aké typy duplicít v SEO praxi poznáme a ako sa im vyhnúť?
Duplicity na webovej stránke

Pozor na duplicitné texty na webe

Duplicitné kategórie produktov

Zlá štruktúra webovej stránky vie vytvoriť duplicitné stránky práve na tie kľúčové slová, na ktoré sa v SEO sústredíte. Ako príklad uvádzame kategórie muži a ženy. V každej z týchto kategórií je produktová stránka s názvom obuv, ktorá má rozdielnu URL adresu, ale rovnaké titulky, nadpisy a väčšinu produktov. Google vyhodnotí kategórie ako duplicitné a nemusí ich zaradiť do indexu, takže sa nezobrazia vo vyhľadávaní.

Tento problém má pomerne jednoduché riešenie. Nastavte si automatické generovanie titulkov a unikátnych popisov na základe dostupných možností CMS a webovej stránky. Zamerajte sa na to, aby mala každá kategória unikátny obsah, a následne otestujte stránku v nástroji Google Search Console.

Titulky a duplicitné nadpisy

Title alebo titulky sú názvy stránok a stručne charakterizujú ich obsah. Sú dôležité ako prvý signál pre rozhodovanie sa, čo sa na stránke nachádza a či je stránka pre používateľa zaujímavá. Titulky sú faktorom, ktorý výrazne ovplyvňuje výsledky vo vyhľadávaní, a preto by mali obsahovať hlavné kľúčové slovo, na ktoré sa stránka zameriava.

V prípade duplicitných titulkov môže vzniknúť rozdelenie hodnoty medzi rôzne stránky, a tým sa výrazne zníži ich hodnota. Dôležitým faktorom sú aj unikátne nadpisy a ich správna štruktúra. Titulky a nadpisy pre dôležité stránky odporúčame vytvoriť manuálne, pri ostatných môžeme využiť automatické generovanie.

PDF súbory a dokumenty

PDF súbory a všetky dokumenty uložené na serveri sa tiež indexujú. Pokiaľ ide o súbory s unikátnym obsahom, ktoré sa na stránke nenachádzajú (napríklad cenník), je to v poriadku. Pokiaľ to sú však dokumenty s rovnakým obsahom, vedia konkurovať dôležitým stránkam, a tým je hodnota pre kľúčové slovo opätovne rozdelená. Takéto stránky odporúčame jednoducho zakázať indexovať v súbore robots.txt

Príklad:
Disallow: /*.pdf

screaming frog PDF

Duplicitné popisy obrázkov

Obrázky sú často podceňované, ale sú kvalitným zdrojom organickej návštevnosti, a to najmä pre e-shopy s veľkým množstvom kategórií a produktov. Snažte sa, aby bol alt a title popis obrázkov unikátny, ale zároveň relevantný.

Mobilné stránky bez označenia

Vaša webová stránka nemá responzívne zobrazenie pre mobilné telefóny, a preto ste sa rozhodli pre založenie novej stránky, ktorá bude plne optimalizovaná pre mobilné telefóny? Výborne. Netreba však zabúdať, že jej obsah bude pravdepodobne úplne rovnaký ako na desktopovej stránke. Pri webových stránkach tohto typu odporúčame pridať značku link rel=“canonical“ na relevantnú, hlavnú stránku.

Na mobilnú stránku pridáme canonical značku:
<link rel=“canonical“ href=“https://bastadigital.com/“ />

Na desktop stránku pridáme informáciu o mobilnej verzii:
<link rel=“alternate“ media=“only screen and (max-width: 640px)“ alternate=”https://m.bastadigital.com/” />

Rada: Duplicity vytvárajú aj stránky vytvorené pre tlač (printové stránky). V tomto prípade odporúčame využiť tlačové štýly (CSS) a staré printové stránky presmerovať cez stavový kód 301.

Indexovanie parametrov, špeciálnych znakov a hľadania

Rôzne filtre, ktoré majú duplicitný obsah, UTM a iné parametre, sa zaindexujú a výrazným spôsobom obmedzia dostupný crawl budget webovej stránky. Crawl budget určuje čas pre vyhľadávacie roboty, ktorý majú na to, aby zozbierali rozsiahle informácie z URL stránok. Po zozbieraní informácií ich následne odovzdávajú vyhľadávačom, ktoré informácie prevedú do výsledkov vo vyhľadávaní, ako ich vidíme my. Roboty vyhľadávačov majú určený maximálny čas, ktorý môžu na webovej stránke stráviť, aby nezaťažili hosting webových stránok.

Pokiaľ má webová stránka tisíce URL adries, robot vyhľadávača nestihne zozbierať všetky URL pre obmedzený čas, a tak sa môže stať, že dôležité stránky nebudú indexované. Okrem toho je každá stránka s parametrom vyhodnotená ako unikátna a vytvára duplicitný obsah. Obidva problémy vieme riešiť pridaním značky link rel=“canonical“.

Príklad indexovaného parametra:

https://bastadigital.com/kompletny-marketing/?priklad-parametra

Canonical verzia bude vyzerať takto:
<link rel=“canonical“ href=“https://bastadigital.com/kompletny-marketing/“ />

canonical značka

Páči sa vám tento obsah?
Dostávajte nový obsah a dôležité novinky o marketingu v digitálnom svete priamo na mail.

Stránkovanie

Zle nastavené stránkovanie je jedným z najčastejších problémov moderných e-shopov. Popis sa nachádza na všetkých stránkach, ktoré sú pre Google unikátne, a tým sa vytvára duplicita. Pokiaľ chceme, aby sa indexoval obsah všetkých stránok bez duplicity, je potrebné zachovať určitý postup. Správne stránkovanie je možné nastaviť v zdrojovom kóde v značke <head>:

Správne nastavenie strany 2 na blogu vyzerá takto:

<link rel=“canonical“ href=“https://bastadigital.com/blog/page/2/“ />
<link rel=“next“ href=“https://bastadigital.com/blog/page/3/“ />
<link rel=“prev“ href=“https://bastadigital.com/blog/page/1/“ />

Canonical určí, ktorá je hlavná verzia danej stránky. Elementy “prev“ a “next“ určujú, ktorá stránka je predchádzajúca a ktorá stránka nasleduje. Google na elementy “prev” a “next” podľa nedávnych správ „pozabudol“, ale odporúča ich pridať pre možnú budúcu aktualizáciu.

Popis kategórie ponechajte iba na hlavnej stránke, napr. na https://bastadigital.com/blog/

Rada: Počet produktov na e-shopoch je väčšinou variabilný, preto nezabudnite presmerovať pravidlom stránku, ktorá nemá žiadne produkty, na poslednú existujúcu stránku s produktmi. Vyhnete sa tak „nekonečnému stránkovaniu“.
Príklad: Pokiaľ stránka 10 neexistuje, ale 8 áno, presmerovať pomocou stavového kódu 302 na stranu 8 (dočasné presmerovanie).

Jazykové mutácie a hreflang

Google rozlišuje jazyk, ktorým je stránka napísaná. Tieto výsledky potom ponúkne používateľom z konkrétnej krajiny či podľa ich preferovaného jazyka. Niekedy sa však stane, že nerozozná správne jazykovú mutáciu a jeden obsah v dvoch jazykoch sa zobrazí vo vyhľadávaní. Riešenie situácie ponúka značka hreflang, ktorá označuje správnu verziu jazykovej mutácie.

Príklad správne použitej značky hreflang:

<link rel=“alternate“ hreflang=“sk“ href=“https://bastadigital.com/sk/” />
<link rel=“alternate“ hreflang=“cs“ href=“https://bastadigital.com/cz/” />
<link rel=“alternate“ hreflang=“en“ href=“https://bastadigital.com/en/“ />

Stránky pre kategóriu by vyzerali takto:

<link rel=“alternate“ hreflang=“sk“ href=“https://bastadigital.com/sk/kompletny-marketing/” />
<link rel=“alternate“ hreflang=“cs“ href=“https://bastadigital.com/cz/kompletni-marketing/” /“>
<link rel=“alternate“ hreflang=“en“ href=“https://bastadigital.com/en/complete-marketing/“ />

Nastavenie hostingu

Webová stránka môže mať niekoľko verzií (verzia s www, bez www, s lomkou, bez lomky…), ktoré Google považuje za samostatné, originálne webové stránky a predpokladá, že sa na nich nachádza unikátny obsah. Rôzne verzie webovej stránky väčšinou možno smerovať aj priamo v hostingu cez kontrol panel v sekcii A záznamov alebo cez CNAME.

hostingové záznamy

Verzia http a https

Pokiaľ ste si pridali na stránku SSL certifikát, netreba zabudnúť na starú verziu webovej stránky. Webové stránky s http:// sa stále indexujú a zobrazujú vo vyhľadávaní. Tieto URL môžete väčšinou presmerovať v administrácii hostingu alebo jednoduchým pravidlom v súbore htaccess:

RewriteEngine on
RewriteCond %{HTTP:X-Forwarded-Proto}
RewriteRule ^.*$ https://%{SERVER_NAME}%{REQUEST_URI} [L,R]

Verzia www, bez www, s lomkou a bez lomky

Výber preferovanej verzie je na vás, druhú verziu je však nutné presmerovať cez stavový kód 301. Niektoré verzie CMS majú presmerovanie prednastavené, pri niektorých si musíte pomôcť sami. Pri presmerovaní verzie s www alebo bez www možno taktiež využiť doménové CNAME záznamy alebo pridať pravidlo v súbore htaccess:

Presmerovanie na verziu s www:

RewriteEngine On
RewriteCond %{HTTP_HOST} !^www. [NC]
RewriteRule ^(.*)$ https://www.%{HTTP_HOST}/$1 [R=301,L]

Presmerovanie na verziu bez www:

RewriteEngine On
RewriteCond %{HTTP_HOST} ^www. [NC]
RewriteRule ^(.*)$ https://%{HTTP_HOST}/$1 [R=301,L]

Presmerovanie na verziu s lomkou:

RewriteEngine on
RewriteCond %{REQUEST_FILENAME} !-f
RewriteRule ^(.*[^/])$ /$1/ [L,R=301]

Presmerovanie na verziu bez lomky:

RewriteEngine on
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule ^(.*)/$ /$1 [L,R=301]

Súbor /index.php

Súbor index.php sa vo väčšine prípadov nachádza na každej podstránke vášho webu. Tento súbor sa nachádza na samostatnej URL adrese a vytvára tak neželaný duplicitný obsah. K súboru sa odporúča pridať značku link rel=“canonical“, prípadne ho presmerovať pomocou stavového kódu 301. Pri presmerovaní však musíte dať pozor, aby nevznikol „redirect loop“, čo môžete vyriešiť detekciou podľa URL.

Subdoména konkuruje hlavnej doméne

Existujúci blog alebo obsah na subdoméne môže v niektorých prípadoch rozptyľovať silu domény. Blog by mal byť na subdoméne len v prípade, ak je jeho obsah unikátny a nepatrí do rovnakej kategórie, ako hlavná webová stránka. Stránku na subdoméne vidí Google ako unikátnu a hlavne samostatnú.

Externé duplicity

Iné stránky kopírujú moje články

Pokiaľ váš text okopírovali a Google ho zaindexuje skôr ako váš obsah, môže ho považovať za originál. Riešením problému s kopírovaním stránky je skorá indexácia vašej stránky, napr. cez Google Search Console.

Rada: kopírovať texty sa neoplatí

Každá webová stránka by sa mala zamerať na tvorbu kvalitného obsahu, ktorý okrem marketingových účelov bude vytvárať pridanú hodnotu pre čitateľa. Kto sa s tvorbou obsahu stretol, vie, že to nie je nič jednoduché. Aj keď skopírovať obsah z externej webovej stránky je pomerne jednoduchá „stratégia“, nebude fungovať.

Stručné tipy na odstránenie duplicít

Značka “canonical“

<link rel=“canonical“ href=”https://example.com/ />
Označí relevantnú verziu webovej stránky, ktorá sa má vyskytnúť v indexe.
Využitie:
Parametre, stránkovanie, súbor index.php

Značka “noindex”

<meta name=“robots“ content=“noindex“ />
Zakáže indexovanie webovej stránky.
Využitie:
Interné vyhľadávanie, PDF, dokumenty a iné súbory, niektoré kategórie alebo individuálne stránky ako košík, backendové skripty atď.

Súbor robots.txt

Slúži ako odporúčanie na neindexovanie stránok, bez <meta name=“robots“ content=“noindex“ /> sa však stále môžu zobraziť vo vyhľadávaní (bez popisku).
Využitie:
PDF, dokumenty a iné súbory, niektoré kategórie alebo individuálne stránky ako košík, backendové skripty atď.

Záznamy A, CNAME a htaccess

Nastavenie rôznych verzií smerovania domény v hostingu vám vie ušetriť čas. Pokiaľ vám to váš hosting nedovoľuje, presmerujte špecifické verzie webovej stránky pomocou pravidla v súbore htaccess.

Nástroje, ktoré vám pomôžu odhaliť duplicitný obsah

Operátor vyhľadávania site:

Vyhľadajte stránky zahrnuté v indexe pomocou operátora vyhľadávania site:.example.com, ktorý vám poskytne základný prehľad o duplicitných URL.

operátor site

Google Search Console

Duplicity môžete vidieť aj priamo v nástroji Google Search Console v časti pokrytia (coverage). Google označuje tieto stránky ako duplicitné, bez využitia značky canonical (Duplicate, without canonical tag).

google search console logo

Screaming Frog

Screaming Frog je nástroj, ktorý je určený priamo pre SEO špecialistov. Z výstupu môžete filtrovať duplicitný obsah (H1, H2, META popisy, titulky, alt popisy pri obrázkoch,…), ako aj URL bez canonical značky.

screaming frog logo

Páči sa vám tento obsah?
Dostávajte nový obsah a dôležité novinky o marketingu v digitálnom svete priamo na mail.
SEO
int(11)
Prihláste sa na odber noviniek v online marketingu
newsletter