Co to jest Google canonical tag i po co go stosować?

Duplikacja treści to jedno z zagrożeń dla pozycji strony internetowej w Google. Szczególnie często problem ten występuje w sklepach internetowych i na innych stronach stosujących systemy zarządzania treścią (np. CMS WordPress) – w których niektóre podstrony są generowane dynamicznie. Dzięki linkom kanonicznym algorytmy Google nie uznają za całkowicie osobne identycznych lub podobnych podstron w naszej witrynie. Korzystając z tagów kanonicznych, Google ustala „kanoniczną”, czyli podstawową, oryginalną wersję strony. Tylko wersja kanoniczna zostanie zindeksowana przez roboty i pojawi się w wynikach wyszukiwania; tylko ona korzysta z „mocy” płynącej z linków zewnętrznych.

Rozwiązanie to obejmuje np. wersje strony z www i bez www, z https:// i bez https:// oraz sortowanie i filtrowanie produktów w sklepach. Metoda ta nie jest jednak pozbawiona pewnych wad i ograniczeń. Istnieją też rozwiązania alternatywne.

Przykłady zastosowań linków kanonicznych, które podajemy w artykule, odnoszą się do sklepów internetowych – dla pozycjonowania innych witryn są jednak analogiczne.

Czym jest link kanoniczny (rel = canonical)? 

Link kanoniczny to element (dokładniej: atrybut, meta-tag) języka znaczników HTML, stosowany głównie w celu uniknięcia duplikacji treści. Umieszcza się go w sekcji <head> obecnej w kodzie źródłowym każdego dokumentu HTML.

Tag canonical został wdrożony wspólnie przez Google, Microsoft i Yahoo i nie powinien sprawiać problemów w starych przeglądarkach i oprogramowaniu dostarczanym przez inne niż Google przedsiębiorstwa. Poprawnie odczytuje go także Bing i inne wyszukiwarki, a nawet Facebook i Twitter. W kodzie strony linki kanoniczne przybierają postać:

rel=”canonical” href=”http://www.twojastrona.pl”

Linkami kanonicznymi posługują się indeksujące nasze witryny roboty (crawlery) Google i innych wyszukiwarek w celu ustalenia, która z wersji strony jest kanoniczna. Strony, które oznaczymy jako niekanoniczne nie będą indeksowane przez wyszukiwarkę i nie znajdą się w wynikach wyszukiwania. Nie wpłyną też negatywnie na pozycję w Google stron kanonicznych. W odróżnieniu od przekierowań 301, nadal będą jednak widoczne dla użytkowników.  

Wadą tagów kanonicznych jest to, że oznaczane nimi podstrony muszą być identyczne lub przynajmniej bardzo podobne. Roboty Google ignoruje niewielkie różnice, nie mamy jednak nigdy pewności, że ich interpretacja będzie poprawna. Istnieje nawet zagrożenie, że przy wprowadzaniu rel = canonical do zbyt różnych wersji stron Google zacznie całkowicie ignorować ten tag w obrębie całej naszej witryny. Tag nie działa więc automatycznie, ale jest tylko sugestią dla robotów Google. Inną jego wadą jest to, że może nie przekazywać całej wartości zduplikowanej podstrony, np. całej mocy prowadzącej do niej linków zewnętrznych.

Spotyka się różne nazwy i określenia linków kanonicznych, o zbliżonych znaczeniach. Należą do nich „tag rel = canonical”, „znacznik rel = canonical”, „canonical link”, „canonical url tag”, „link canonical tag”, „canonical tag” itp.

Adresy duplikatów, których indeksowanie w Google uniemożliwia rel = canonical, mogą wyglądać następująco:

  • http://twojastrona.pl/podstrona.htm
  • http://www.twojastrona.pl/podstrona.htm
  • https://www.twojastrona.pl/podstrona.htm
  • http://twojastrona.pl/podstrona.htm?ref=inna-podstrona
  • http://twojastrona.pl/podstrona.htm?sort=sortuj-od-najtanszych
  • http://twojastrona.pl/podstrona.htm/drukuj 
  • http://twojastrona.pl/index.php

Linki kanoniczne a duplikacja wewnętrzna. Stosowanie linków kanonicznych

Duplikacja wewnętrzna (duplicate content) polega na powieleniu identycznych treści w obrębie tej samej witryny, Unikanie duplikacji to jeden z najważniejszych czynników rankingowych w Google. Ze względu na fakt, że większość duplikatów powstaje automatycznie, właściciele stron nie zdają sobie często sprawy z ich istnienia. Wdrożenie linków kanonicznych pozwala na łatwe i automatyczne uniknięcie tej sytuacji, bez konieczności analizowania tysięcy podstron. Duplikacji wewnętrznej nie należy mylić z powielaniem treści znajdujących się na innych stronach internetowych, np. kopiowaniem opisów produktów (które także jest niezwykle niekorzystne dla pozycji strony). Linki kanoniczne stosuje się jednak czasem także wtedy, gdy pobieramy treści z innych podstron: pomaga więc również w walce z duplikacją zewnętrzną.

Jako główne przykłady zastosowania linków kanonicznych omawia się często wersje strony z https:// i bez https://, z www i bez www oraz wersje mobilne i desktopowe strony. We wszystkich tych przypadkach linki kanoniczne łatwo jednak zastąpić przekierowaniami 301, wpisywanymi jako reguły w pliku .htcaccess. Dla większości stron większe znaczenie mają zastosowania rel = canonical dotyczące sortowania produktów.

W sklepach internetowych występuje często stronicowanie produktów, np. w formie archiwów: przekierowanie każdej podstrony na główną stronę kategorii jest korzystne dla SEO sklepów. Również w przypadku filtrowania i sortowania produktów w sklepie uzyskujemy często identyczną treść przy różnych adresach. Inną częstą sytuacją, w której stosuje się rel = canonical, są generowane automatycznie długie i nieprzyjazne dla użytkowników adresy strony (np. zawierające zbędny element index.php).

Linki kanoniczne stosujemy też w sytuacjach, gdy warianty tego samego produktu mają w sklepie osobne podstrony (np. przy różnych kolorach tych samych ubrań). Jeśli mamy więc w sklepie podstrony z opisami produktów różniące się tylko drobnymi szczegółami (kolorem, rozmiarem) należy stworzyć główny opis produktu, do którego za pomocą rel = canonical kierują szczegółowe podstrony. Istnieją także rzadziej spotykane możliwości tworzenia duplikatów, np. osobne wersje przeznaczone do wydruku, kanały RSS, różne wersje językowe strony oraz galerie grafik.

Wdrożenie linków kanonicznych na stronie internetowej

Często wykorzystuje się inne niż linki kanoniczne metody, niekiedy niezalecane przez Google i sprawiające problemy techniczne. Należą do nich przekierowania 301, mapy stron i reguły wpisywane w pliku robots.txt. Przekierowanie 301 sprawia, że strona przestaje być widoczna dla użytkownika (który zostaje automatycznie przekierowany na inną podstronę), nie może być więc stosowane wymiennie z tagiem kanonicznym. Wersje kanoniczne można określić w mapie strony (sitemap), są jednak dla robotów Google słabszym sygnałem, niż link kanoniczny. Wpisy w robots.txt bywają ignorowane nawet przez „przyjazne” roboty, mają zresztą inne zadania (np. reguła noindex zaleca robotom nieindeksowanie strony). Odmienne metody stosuje się w przypadku stron AMP.

We wdrażaniu linków kanonicznych można popełnić wiele błędów – tak technicznych, jak i bezpośrednio związanych z SEO:

  • Należy zawsze linkować ze strony uboższej w treść do strony bogatszej w treść.
  • Strona kanoniczna nie powinna być wykluczona przez plik robots.txt.
  • Strona kanonicza musi rzeczywiście istnieć.
  • Linki kanoniczne wdraża się w sekcji, nie w sekcji.
  • Dużym błędem jest stosowanie wielu różnych tagów kanonicznych – roboty Google otrzymują wtedy sprzeczne informacje, które ignorują.
  • Strona kanoniczna powinna znajdować się wyżej w wynikach wyszukiwania, niż niekanoniczna.
  • Literówki w adresach to nie drobne błędy, ale duże zagrożenie dla całej witryny.
  • Ustawianie linków kanonicznych w paginacji podstron na pierwszą podstronę (np. z drugiej i trzeciej strony archiwum na pierwszą). Rozwiązania tego nie trzeba jednak wykluczać we wszystkich sytuacjach.

About the author