Pozor na duplicitné texty na webe
Duplicitné kategórie produktov
Zlá štruktúra webovej stránky vie vytvoriť duplicitné stránky práve na tie kľúčové slová, na ktoré sa v SEO sústredíte. Ako príklad uvádzame kategórie muži a ženy. V každej z týchto kategórií je produktová stránka s názvom obuv, ktorá má rozdielnu URL adresu, ale rovnaké titulky, nadpisy a väčšinu produktov. Google vyhodnotí kategórie ako duplicitné a nemusí ich zaradiť do indexu, takže sa nezobrazia vo vyhľadávaní.
Tento problém má pomerne jednoduché riešenie. Nastavte si automatické generovanie titulkov a unikátnych popisov na základe dostupných možností CMS a webovej stránky. Zamerajte sa na to, aby mala každá kategória unikátny obsah, a následne otestujte stránku v nástroji Google Search Console.
Titulky a duplicitné nadpisy
Title alebo titulky sú názvy stránok a stručne charakterizujú ich obsah. Sú dôležité ako prvý signál pre rozhodovanie sa, čo sa na stránke nachádza a či je stránka pre používateľa zaujímavá. Titulky sú faktorom, ktorý výrazne ovplyvňuje výsledky vo vyhľadávaní, a preto by mali obsahovať hlavné kľúčové slovo, na ktoré sa stránka zameriava.
V prípade duplicitných titulkov môže vzniknúť rozdelenie hodnoty medzi rôzne stránky, a tým sa výrazne zníži ich hodnota. Dôležitým faktorom sú aj unikátne nadpisy a ich správna štruktúra. Titulky a nadpisy pre dôležité stránky odporúčame vytvoriť manuálne, pri ostatných môžeme využiť automatické generovanie.
PDF súbory a dokumenty
PDF súbory a všetky dokumenty uložené na serveri sa tiež indexujú. Pokiaľ ide o súbory s unikátnym obsahom, ktoré sa na stránke nenachádzajú (napríklad cenník), je to v poriadku. Pokiaľ to sú však dokumenty s rovnakým obsahom, vedia konkurovať dôležitým stránkam, a tým je hodnota pre kľúčové slovo opätovne rozdelená. Takéto stránky odporúčame jednoducho zakázať indexovať v súbore robots.txt
Príklad:
Disallow: /*.pdf
Duplicitné popisy obrázkov
Obrázky sú často podceňované, ale sú kvalitným zdrojom organickej návštevnosti, a to najmä pre e-shopy s veľkým množstvom kategórií a produktov. Snažte sa, aby bol alt a title popis obrázkov unikátny, ale zároveň relevantný.
Mobilné stránky bez označenia
Vaša webová stránka nemá responzívne zobrazenie pre mobilné telefóny, a preto ste sa rozhodli pre založenie novej stránky, ktorá bude plne optimalizovaná pre mobilné telefóny? Výborne. Netreba však zabúdať, že jej obsah bude pravdepodobne úplne rovnaký ako na desktopovej stránke. Pri webových stránkach tohto typu odporúčame pridať značku link rel=“canonical“ na relevantnú, hlavnú stránku.
Na mobilnú stránku pridáme canonical značku:
<link rel=“canonical“ href=“https://bastadigital.com/“ />
Na desktop stránku pridáme informáciu o mobilnej verzii:
<link rel=“alternate“ media=“only screen and (max-width: 640px)“ alternate=”https://m.bastadigital.com/” />
Rada: Duplicity vytvárajú aj stránky vytvorené pre tlač (printové stránky). V tomto prípade odporúčame využiť tlačové štýly (CSS) a staré printové stránky presmerovať cez stavový kód 301.
Indexovanie parametrov, špeciálnych znakov a hľadania
Rôzne filtre, ktoré majú duplicitný obsah, UTM a iné parametre, sa zaindexujú a výrazným spôsobom obmedzia dostupný crawl budget webovej stránky. Crawl budget určuje čas pre vyhľadávacie roboty, ktorý majú na to, aby zozbierali rozsiahle informácie z URL stránok. Po zozbieraní informácií ich následne odovzdávajú vyhľadávačom, ktoré informácie prevedú do výsledkov vo vyhľadávaní, ako ich vidíme my. Roboty vyhľadávačov majú určený maximálny čas, ktorý môžu na webovej stránke stráviť, aby nezaťažili hosting webových stránok.
Pokiaľ má webová stránka tisíce URL adries, robot vyhľadávača nestihne zozbierať všetky URL pre obmedzený čas, a tak sa môže stať, že dôležité stránky nebudú indexované. Okrem toho je každá stránka s parametrom vyhodnotená ako unikátna a vytvára duplicitný obsah. Obidva problémy vieme riešiť pridaním značky link rel=“canonical“.
Príklad indexovaného parametra:
https://bastadigital.com/kompletny-marketing/?priklad-parametra
Canonical verzia bude vyzerať takto:
<link rel=“canonical“ href=“https://bastadigital.com/kompletny-marketing/“ />
Stránkovanie
Zle nastavené stránkovanie je jedným z najčastejších problémov moderných e-shopov. Popis sa nachádza na všetkých stránkach, ktoré sú pre Google unikátne, a tým sa vytvára duplicita. Pokiaľ chceme, aby sa indexoval obsah všetkých stránok bez duplicity, je potrebné zachovať určitý postup. Správne stránkovanie je možné nastaviť v zdrojovom kóde v značke <head>:
Správne nastavenie strany 2 na blogu vyzerá takto:
<link rel=“canonical“ href=“https://bastadigital.com/blog/page/2/“ />
<link rel=“next“ href=“https://bastadigital.com/blog/page/3/“ />
<link rel=“prev“ href=“https://bastadigital.com/blog/page/1/“ />
Canonical určí, ktorá je hlavná verzia danej stránky. Elementy “prev“ a “next“ určujú, ktorá stránka je predchádzajúca a ktorá stránka nasleduje. Google na elementy “prev” a “next” podľa nedávnych správ „pozabudol“, ale odporúča ich pridať pre možnú budúcu aktualizáciu.
Popis kategórie ponechajte iba na hlavnej stránke, napr. na https://bastadigital.com/blog/
Rada: Počet produktov na e-shopoch je väčšinou variabilný, preto nezabudnite presmerovať pravidlom stránku, ktorá nemá žiadne produkty, na poslednú existujúcu stránku s produktmi. Vyhnete sa tak „nekonečnému stránkovaniu“.
Príklad: Pokiaľ stránka 10 neexistuje, ale 8 áno, presmerovať pomocou stavového kódu 302 na stranu 8 (dočasné presmerovanie).
Jazykové mutácie a hreflang
Google rozlišuje jazyk, ktorým je stránka napísaná. Tieto výsledky potom ponúkne používateľom z konkrétnej krajiny či podľa ich preferovaného jazyka. Niekedy sa však stane, že nerozozná správne jazykovú mutáciu a jeden obsah v dvoch jazykoch sa zobrazí vo vyhľadávaní. Riešenie situácie ponúka značka hreflang, ktorá označuje správnu verziu jazykovej mutácie.
Príklad správne použitej značky hreflang:
<link rel=“alternate“ hreflang=“sk“ href=“https://bastadigital.com/sk/” />
<link rel=“alternate“ hreflang=“cs“ href=“https://bastadigital.com/cz/” />
<link rel=“alternate“ hreflang=“en“ href=“https://bastadigital.com/en/“ />
Stránky pre kategóriu by vyzerali takto:
<link rel=“alternate“ hreflang=“sk“ href=“https://bastadigital.com/sk/kompletny-marketing/” />
<link rel=“alternate“ hreflang=“cs“ href=“https://bastadigital.com/cz/kompletni-marketing/” /“>
<link rel=“alternate“ hreflang=“en“ href=“https://bastadigital.com/en/complete-marketing/“ />
Nastavenie hostingu
Webová stránka môže mať niekoľko verzií (verzia s www, bez www, s lomkou, bez lomky…), ktoré Google považuje za samostatné, originálne webové stránky a predpokladá, že sa na nich nachádza unikátny obsah. Rôzne verzie webovej stránky väčšinou možno smerovať aj priamo v hostingu cez kontrol panel v sekcii A záznamov alebo cez CNAME.
Verzia http a https
Pokiaľ ste si pridali na stránku SSL certifikát, netreba zabudnúť na starú verziu webovej stránky. Webové stránky s http:// sa stále indexujú a zobrazujú vo vyhľadávaní. Tieto URL môžete väčšinou presmerovať v administrácii hostingu alebo jednoduchým pravidlom v súbore htaccess:
RewriteEngine on
RewriteCond %{HTTP:X-Forwarded-Proto}
RewriteRule ^.*$ https://%{SERVER_NAME}%{REQUEST_URI} [L,R]
Verzia www, bez www, s lomkou a bez lomky
Výber preferovanej verzie je na vás, druhú verziu je však nutné presmerovať cez stavový kód 301. Niektoré verzie CMS majú presmerovanie prednastavené, pri niektorých si musíte pomôcť sami. Pri presmerovaní verzie s www alebo bez www možno taktiež využiť doménové CNAME záznamy alebo pridať pravidlo v súbore htaccess:
Presmerovanie na verziu s www:
RewriteEngine On
RewriteCond %{HTTP_HOST} !^www. [NC]
RewriteRule ^(.*)$ https://www.%{HTTP_HOST}/$1 [R=301,L]
Presmerovanie na verziu bez www:
RewriteEngine On
RewriteCond %{HTTP_HOST} ^www. [NC]
RewriteRule ^(.*)$ https://%{HTTP_HOST}/$1 [R=301,L]
Presmerovanie na verziu s lomkou:
RewriteEngine on
RewriteCond %{REQUEST_FILENAME} !-f
RewriteRule ^(.*[^/])$ /$1/ [L,R=301]
Presmerovanie na verziu bez lomky:
RewriteEngine on
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule ^(.*)/$ /$1 [L,R=301]
Súbor /index.php
Súbor index.php sa vo väčšine prípadov nachádza na každej podstránke vášho webu. Tento súbor sa nachádza na samostatnej URL adrese a vytvára tak neželaný duplicitný obsah. K súboru sa odporúča pridať značku link rel=“canonical“, prípadne ho presmerovať pomocou stavového kódu 301. Pri presmerovaní však musíte dať pozor, aby nevznikol „redirect loop“, čo môžete vyriešiť detekciou podľa URL.
Subdoména konkuruje hlavnej doméne
Existujúci blog alebo obsah na subdoméne môže v niektorých prípadoch rozptyľovať silu domény. Blog by mal byť na subdoméne len v prípade, ak je jeho obsah unikátny a nepatrí do rovnakej kategórie, ako hlavná webová stránka. Stránku na subdoméne vidí Google ako unikátnu a hlavne samostatnú.
Externé duplicity
Iné stránky kopírujú moje články
Pokiaľ váš text okopírovali a Google ho zaindexuje skôr ako váš obsah, môže ho považovať za originál. Riešením problému s kopírovaním stránky je skorá indexácia vašej stránky, napr. cez Google Search Console.
Rada: kopírovať texty sa neoplatí
Každá webová stránka by sa mala zamerať na tvorbu kvalitného obsahu, ktorý okrem marketingových účelov bude vytvárať pridanú hodnotu pre čitateľa. Kto sa s tvorbou obsahu stretol, vie, že to nie je nič jednoduché. Aj keď skopírovať obsah z externej webovej stránky je pomerne jednoduchá „stratégia“, nebude fungovať.
Stručné tipy na odstránenie duplicít
Značka “canonical“
<link rel=“canonical“ href=”https://example.com/ />
Označí relevantnú verziu webovej stránky, ktorá sa má vyskytnúť v indexe.
Využitie:
Parametre, stránkovanie, súbor index.php
Značka “noindex”
<meta name=“robots“ content=“noindex“ />
Zakáže indexovanie webovej stránky.
Využitie:
Interné vyhľadávanie, PDF, dokumenty a iné súbory, niektoré kategórie alebo individuálne stránky ako košík, backendové skripty atď.
Súbor robots.txt
Slúži ako odporúčanie na neindexovanie stránok, bez <meta name=“robots“ content=“noindex“ /> sa však stále môžu zobraziť vo vyhľadávaní (bez popisku).
Využitie:
PDF, dokumenty a iné súbory, niektoré kategórie alebo individuálne stránky ako košík, backendové skripty atď.
Záznamy A, CNAME a htaccess
Nastavenie rôznych verzií smerovania domény v hostingu vám vie ušetriť čas. Pokiaľ vám to váš hosting nedovoľuje, presmerujte špecifické verzie webovej stránky pomocou pravidla v súbore htaccess.
Nástroje, ktoré vám pomôžu odhaliť duplicitný obsah
Operátor vyhľadávania site:
Vyhľadajte stránky zahrnuté v indexe pomocou operátora vyhľadávania site:.example.com, ktorý vám poskytne základný prehľad o duplicitných URL.
Google Search Console
Duplicity môžete vidieť aj priamo v nástroji Google Search Console v časti pokrytia (coverage). Google označuje tieto stránky ako duplicitné, bez využitia značky canonical (Duplicate, without canonical tag).
Screaming Frog
Screaming Frog je nástroj, ktorý je určený priamo pre SEO špecialistov. Z výstupu môžete filtrovať duplicitný obsah (H1, H2, META popisy, titulky, alt popisy pri obrázkoch,…), ako aj URL bez canonical značky.