grafika: fotolia.pl
Chciałbym przybliżyć Wam problem duplicate content i wpływu tego zjawiska na prowadzenie działań SEO. Co ciekawe, zjawisko to występuje nie tylko w dużych portalach czy serwisach e-commerce, ale również na małych stronach firmowych czy blogach. Przygotowując audyty SEO, nie spotkałem się jeszcze z serwisem, który nie posiadałby kilku wersji tej samej podstrony, produktu czy artykułu.
Zobacz również
Na początku chciałbym zaznaczyć, iż Google nie nakłada filtrów za występowanie duplikacji treści w obrębie serwisu czy też poza nim. Zagłębiając się jednak w dalszą treść artykułu dowiecie się, że DC może wywołać wiele problemów, które ostatecznie mogą spowodować spadek w rankingu.
Czy moja strona ma problem z duplikacją treści?
Na samym początku musimy poszukać ewentualnych wystąpień DC w obrębie naszego serwisu. W tym celu możemy skorzystać z wielu darmowych narzędzi. Najprostszym sposobem będzie jednak skopiowanie dowolnego fragmentu treści ze strony i sprawdzenie w Google, czy znajduje się on na kilku podstronach w naszym serwisie. Aby ograniczyć wyniki wyłącznie do naszej strony sugeruję użyć operatora site:twojadomena.pl. Czynność tą najlepiej jest powtórzyć kilka razy dla różnych treści.
Movember/Wąsopad: jak marki zachęcają do profilaktyki męskich nowotworów [PRZEGLĄD]
Niestety metoda ta nie daje nam 100% gwarancji wykrycia duplikacji treści chociażby dlatego, iż w przypadku dużego serwisu, nie będziemy sprawdzać każdej podstrony osobno. Aby uzyskać dokładniejsze dane sugeruję wykorzystać Narzędzia Google dla Webmasterów. W kategorii Optymalizacja -> Udoskonalenia HTML znajdziecie informacje o powtórzeniach tytułów oraz opisów stron. Jest to miejsce, do którego każdy z Was powinien zajrzeć w poszukiwaniu duplicate content.
Słuchaj podcastu NowyMarketing
Osobom, które nie lubią narzędzi Google (też się tacy zdarzają), sugeruję wykorzystać darmowy program o nazwie Xenu’s Link Sleuth.
Do czego może doprowadzić duplikacja treści?
Tak jak wspominałem na początku artykułu, wewnętrzna jak i zewnętrzna duplikacja treści nie spowoduje nałożenia filtru na serwis (oczywiście sytuacja wygląda inaczej jeśli serwis jest zwykłym spamem tworzonym wyłącznie na bazie zduplikowanej treści).
Z chwilą, gdy robot Google trafia na DC w obrębie jednej domeny, sam decyduje czy podstrona A, B, a może C zawiera oryginalną treść. Może nastąpić sytuacja, w której robot dokona złego wyboru i tym samym w wynikach wyszukiwania będzie pojawiać się strona, która dla nas nie jest priorytetowa.
Kolejnym negatywnym skutkiem może być utrata tzw. „link juice”, czyli wartości linków prowadzących do strony internetowej np. w momencie kiedy strona główna występuje pod kilkoma różnymi adresami, do których prowadzą odnośniki zewnętrzne. W przypadku, gdy jesteś właścicielem dużego serwisu czy sklepu internetowego musisz również liczyć się z dużą ilością zużytego transferu, jaką generują roboty wyszukiwarek. W momencie kiedy w serwisie znajduje się duża ilość zduplikowanej treści, roboty zużywają transfer, a co za tym idzie generują niepotrzebne koszty.
Kolejnym istotnym skutkiem wystąpienia DC może być zmniejszenie się skuteczności robotów wyszukiwarek w poszukiwaniu unikalnej treści, co przekłada się na rzadsze wizyty robotów w serwisie.
Najczęstsze przyczyny występowania duplicate content
Przeprowadzając audyty SEO można trafić na wiele miejsc, które powodują DC w obrębie serwisu. Poniżej najczęstsze przypadki.
Adres z www i bez www
Nie wszyscy pewnie wiedzą, że dla Google strona zawierająca prefiks www jest innym adresem niż strona, która go nie zawiera. Zapominając o tym bardzo często doprowadzamy do sytuacji, kiedy nasz serwis występuje pod dwoma różnymi adresami, co powoduje całościową duplikację naszej strony. Aby uniknąć takiej sytuacji należy zdecydować się na jedną formę, a następnie utworzyć przekierowanie 301. Trzeba jednak pamiętać aby przekierowanie zostało utworzone w modelu 1:1, czyli konkretną podstronę w jednym serwisie należy przekierować na odpowiadającą jej podstronę w drugim serwisie.
index.php/html w adresie URL
Kolejnym przykładem DC jest sytuacja, w której strony w serwisie występują pod adresami zawierającymi np. element index.php lub index.html i adresami, które tego elementu nie posiadają np. www.domena.pl i www.domena.pl/index.php. Podobnie jak w pierwszym przypadku, również tu rozwiązaniem jest utworzenie przekierowania 301 na adresy, które nie posiadają tych elementów.
Kilka podstron z tym samym produktem
Problem ten pojawia się bardzo często w momencie, gdy jeden produkt znajduje się w kilku kategoriach tematycznych, a jego adres URL może posiadać różne formy, w zależności od ścieżki, jaką przebył użytkownik aby się do niego dostać. Dodatkowo, duplikacja powstaje również w momencie, kiedy jeden produkt posiada kilka rozmiarów lub wersji kolorystycznych. Najlepszym rozwiązaniem w tej sytuacji będzie prezentowanie produktów pod adresami URL, które nie posiadają kategorii i cech produktów np. www.domena.pl/nazwa-produktu. Kolejna możliwość to użycie stron kanonicznych, czyli preferowanych wersji pewnego zestawu stron o podobnej lub tej samej treści.
Miejcie na uwadze, że są to tylko trzy przykłady, a problem duplikacji treści może występować w wielu innych miejscach np. podczas paginacji lub przy występowaniu parametrów śledzących w adresach URL.
Mateusz Rzetecki – SEO Specialist w Bluerank
SEO Specialist w Bluerank. Realizuje kampanie search engine optimization, m.in. dla firm z branży budowlanej, farmaceutycznej, motoryzacyjnej, jak i marek z sektora e-commerce. Absolwent Politechniki Poznańskiej. Autor artykułów na blogu bluerank.blogspot.com.