Het begint bij het herkennen

6 aanhoudende mythes over duplicate content

Duplicate content zit soms in een klein hoekje en is iets wat veel webmasters bezig houdt. Er wordt in de online marketing wereld dan ook veel over gesproken en veel over beweert. Wat is waar en wat is slechts een mythe? Een reden om wat dieper te duiken in zes aanhoudende mythes over duplicate content.

HomeHelpcentrumSEO – zoekmachine optimalisatie6 aanhoudende mythes over duplicate content

Inhoud van dit artikel:

Sinds de beruchte Google Panda update, waarbij ‘content farms’ buitenspel werden gezet, is er een angst onder webmasters dat duplicate content zorgt voor een slechter organisch resultaat. Echter is lang niet alles wat u leest en hoort over duplicate content waar. Hieronder licht SDIM een aantal van de meest voorkomende mythes toe.

 

Mythe #1: De Google Duplicate Content Penalty

Laten we de lijst aftrappen met misschien wel de belangrijkste duplicate content mythe van allemaal: het bestaan van de zogenaamde duplicate content penalty. Het is een feit dat veel bedrijven, die voor de Google Panda update vrij spel hadden met het kopiëren en plakken van content van andere sites, al snel hun digitale deuren konden sluiten. Echter is het een misvatting dat Google penalties geeft aan websites omdat deze duplicate content bevatten. Dit zegt Google zelf over duplicate content en de bijbehorende straffen:

Google streeft ernaar pagina’s met verschillende gegevens te indexeren en weer te geven. […] Dubbele content op een site is geen reden om stappen tegen die site te ondernemen, tenzij het erop lijkt dat de dubbele content is bedoeld om te misleiden en om de resultaten van zoekmachines te manipuleren. Als je site problemen heeft met dubbele content en je het bovenstaande advies niet opvolgt, kiezen wij de versie van de content die in onze zoekresultaten wordt weergegeven.

Er is dus een duidelijk onderscheid in de manier waarop Google naar duplicate content kijkt. Duplicate content an sich is geen reden voor Google om te straffen. Wanneer Google duplicate content aantreft op de website en er is geen ‘no index’ of ‘canonical tag’ aangebracht in de code, kiest Google namelijk zelf de pagina die getoond zal worden aan de bezoeker. De andere variant wordt wel opgenomen in de zoekresultaten, maar zal zelden vertoond worden door zijn lage ranking. Er volgt dus geen penalty. Google herkent namelijk wanneer er sprake is van doelmatige duplicate content.

Wat is wel reden tot handmatige acties van Google?

Er is echter wel een manier waarop duplicate content Google dwingt maatregelen te nemen. Dit is wanneer duplicate content gebruikt wordt om de zoekresultaten en de websitebezoeker te misleiden. Websites die zich hier schuldig aan maken riskeren een lagere ranking of het compleet uitsluiten van de pagina in de zoekresultaten. Google waakt dus voor de gebruikerservaring, niet voor duplicate content zelf.

Dit gezegd hebbende moet er wel benadrukt worden, dat het gebruik van internal duplicate content af te raden is en vermeden dient te worden. Google kan namelijk besluiten dat de tweede versie van uw duplicate content getoond zal worden, terwijl u liever de eerste versie in de zoekresultaten wilt hebben. Indien duplicate content niet vermeden kan worden, zijn er oplossingen beschikbaar (zoals een canonical tag) om zoekmachines goed rond te leiden op uw website. 

 

Mythe #2:  Duplicate content ontstaat altijd opzettelijk

Deze mythe gaat over de kernvraag: wat is duplicate content? Het is een misvatting om te denken dat duplicate content alleen ontstaat wanneer bewust dezelfde content op een andere pagina wordt geplaatst. Er zijn namelijk vele andere manieren waarop, onbewust, duplicate content kan ontstaan. Zo kunnen de volgende situaties ook duplicate content opleveren:

  • Filterpagina’s in bijvoorbeeld een webshop die dezelfde resultaten tonen, maar via andere filterinstellingen (en dus andere URLs) bereikt kunnen worden. Ditzelfde geldt voor URLs waar parameters aan toegevoegd worden.
  • Als de printversie van een pagina via een URL bereikbaar is kan dit duplicate content opleveren. Bijvoorbeeld: www.voorbeeld.nl/productomschrijving en www.voorbeeld.nl/print/productomschrijving kunnen beide dezelfde content bevatten.
  • Een www en non-www versie van de website die los van elkaar bereikt kunnen worden. Bijvoorbeeld: https://www.voorbeeld.nl en https://voorbeeld.nl. 

De bovenstaande punten kunnen als volgt geïllustreerd worden:

  • https://www.voorbeeld.nl/ (homepage)
  • https://voorbeeld.nl/ (zonder ‘www’)
  • http://www.voorbeeld.nl/ (geen HTTPS)
  • http://www.voorbeeld.nl/?ref=facebook (parameters)

Voor ons lijken deze pagina’s hetzelfde, want ze bieden dezelfde content. Echter kan de zoekmachine dit als 4 verschillende URLs zien. Hierdoor ziet de crawler vier maal dezelfde context op vier verschillende URLs. In dat geval kan er duplicate content aanwezig zijn. Het is dus van belang om verder te kijken dan duplicate content binnen pagina’s. Ook de website structuur en techniek kan voor duplicate content zorgen. Blijf dus scherp op websitestructuur en breng de juiste verwijzingen aan.

 

Mythe #3: Scrapers schaden de rankings van uw site

Scrapers zijn al langer een doorn in het oog van veel webmasters. Zij kopiëren het artikel waar u zo lang aan gewerkt heeft en plakken het op hun website. Is uw harde werk nu opeens duplicate content? Het antwoord is gelukkig nee. Maar laten we allereerst onderscheid maken tussen scrapers en plagiaatplegers. 

Scrapers houden zich bezig met het schrapen van de content op websites om deze vervolgens te plaatsen op hun eigen website. Dit gebeurt in grote aantallen en vaak kopiëren en plakken ze de gehele content, inclusief de linkverwijzingen. Zijn zij schadelijk voor uw website? Nee, aldus Google zelf. Scrapers die uw content opnieuw op hun eigen site plaatsen, hebben geen negatief effect op uw website. Het is dus niet nodig om naar de Google Disavow tool te grijpen.

Google crawlt een website met enige regelmaat en weet dus, dat wanneer hetzelfde artikel op een later tijdstip op een andere website verschijnt, welk artikel het origineel is. Tel daarbij het feit dat Google de autoriteit en verkeer van de website kan vergelijken met uw website. Is Google feilloos? Nee, ook Google kan wel eens verward zijn wie de originele auteur is. In dat geval bieden zij een formulier aan waarmee u actie kunt ondernemen. 

Wat als er sprake is van plagiaat?

Plagiaatplegers gaan echter anders te werk. Zij kopiëren en plakken niet alleen de content, maar eisen ook de auteursrechten op. Voor deze groep is het wel belangrijk om waakzaam te zijn. Zoals gezegd is Google niet feilloos in het herkennen van de originele content. In dit geval kan er dus wel sprake zijn van duplicate content. Het kan zelfs zo zijn dat de plagiaatpleger, met uw content, hoger rankt dan u zelf. Mocht u een plagiaatpleger tegenkomen, kunt u een verzoek van verwijdering bij Google indienen.

 

Mythe #4: Dezelfde content in een andere taal is duplicate content

Zoekmachinecrawlers, zoals die van Google, worden steeds geavanceerder en zijn niet langer ééntalig opgevoed. De crawler begrijpt content in andere talen steeds beter. Dus het is geen gekke gedachte om te denken dat, wanneer dezelfde content in een andere taal op de website geplaatst wordt, er sprake is van duplicate content. Dit is echter niet het geval. Er zijn technische mogelijkheden om toch dezelfde content te kunnen gebruiken voor een meertalige website. Wanneer een webmaster op een juiste manier hreflang attributen gebruikt en wanneer de teksten handmatig herschreven zijn in de andere taal, zal er geen sprake zijn van een duplicate content issue. Echter wanneer u content in dezelfde taal plaatst op een alternatieve taalpagina of wanneer u content automatisch laat vertalen door bijvoorbeeld Google Translate, kan er inderdaad sprake zijn van duplicate content.

Het wordt dus altijd aangeraden een tekst handmatig te vertalen. Hiermee kunt u de schrijfwijze en woordkeuze van de tekst meteen aanpassen naar de bewoners van het desbetreffende land en speelt u beter in op uw doelgroep.

 

Mythe #5: Een canonical tag is een garantie tegen duplicate content

Er zit een kern van waarheid in, maar de waarheid is genuanceerder dan de stelling beweert. Het gebruik van een canonical wordt zeker door Google gestimuleerd. Het blijft echter een signaal aan de crawler en geen opdracht. De crawler kan er nog altijd voor kiezen om de canonical URL niet te accepteren en zelf te kiezen wat het beste resultaat is. Het komt echter weinig voor dat Google de canonical tag negeert en zelf de keuze maakt. Het gebruik van de canonical tag blijft dus een wijze zet in de juiste richting voor de crawler. Zo vertelt u de crawler dat de pagina waar hij zich op bevindt, een kopie is van een andere pagina en dat u liever heeft dat een andere pagina hoger in de zoekresultaten komt.

Het nadeel is echter dat de zoekmachine nog steeds beide pagina’s crawlt en dus ‘crawlbudget’ gebruikt, terwijl je zegt dat er maar één versie nodig is in de zoekresultaten. Zorg er dus voor dat beide pagina’s unieke content bevatten, zodat een verwijzende canonical tag niet nodig is en beide pagina’s in de zoekresultaten kunnen komen.

 

Mythe #6: Een stuk tekst hergebruiken op een andere pagina is duplicate content

Het komt regelmatig voor dat informatie over bijvoorbeeld een merk of product voor meerdere pagina’s relevant is. Kun je dan helemaal nooit tekst hergebruiken? Jawel, met mate. Pas als de meerderheid van een pagina identiek is aan een andere pagina spreek je over duplicate content. Dus als je een paar zinnen hetzelfde hebt op een andere pagina, loopt je pagina geen risico. In de praktijk komt het dus regelmatig voor dat een bepaald element op pagina’s hetzelfde is. Wel moet benadrukt worden dat pagina’s zo uniek mogelijk gemaakt moeten worden.

Neem contact met ons op voor meer informatie, een offerte op maat, of antwoorden op al uw online marketing vragen.

023 - 711 44 01 Neem contact op

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *