Duplicate content en bloggen • 2/2 • Oplossingen voor de SEO  [checklist]

Duplicate content, bloggen en SEO • 2/2 • Wat kun je doen als het niet anders is?

Wanneer je te maken hebt met dupli­cate content, bete­kent dit vaak dat er meer­dere pagina’s met dezelfde content op de web­site staan. Voor Google kan dit verwar­rend zijn, want welke pagina moet de zoek­machine nou weer­geven in de resul­taten?

Maar maak je geen zorgen, er zijn oplos­singen voor dit probleem! In dit blog­artikel zoomen we aan de hand van een check­list in op de oplos­singen en vertel­len we hoe je Google op weg helpt met de juiste versie te kiezen. Zo zorg je dat jouw favo­riete con­tent toch goed scoort in de zoek­machine!

Gaat het over het optimaliseren van apps, dan spreek je over ‘App Store Optimalisatie’ (ASO). Je kunt gerust verder lezen, want tussen SEO en ASO bestaan zeer veel overeenkomsten. Zeker met betrekking tot de materie in dit blogartikel. Bij uitzondering gebruiken we in dit blogartikel niet steeds ‘websites en apps’ zoals je van ons gewend bent. Dit zou de tekst niet prettiger leesbaar maken en dus kiezen we hier alleen voor het begrip website.

Wat gaan we doen?

  • Deel 1 – We zoom­den in op wat dupli­cate content is, beke­ken de geva­ren ervan en hoe groot die geva­ren werke­lijk zijn.  Terug naar deel 1.
  • Deel 2 – We bespre­ken de stap­pen die je kunt onder­nemen om Google te helpen te begrijpen welke content de voor­keur heeft voor verto­ning in de zoek­machine (en welke niet).

Eerst meer weten?

Lees dan deel 1.

Of ga naar het over­zicht van alle blog­artikelen over zake­lijk bloggen. Als wij je op de hoogte mogen houden van nieuwe artikelen over blog­gen en gerela­teerde onder­­werpen, meld je dan direct even aan voor de gratis e‑mailalert.  Klik hier.

 

Voor we verder gaan

We begonnen deze serie met een uitleg over diverse vormen van duplicate content en hoe dit kan ontstaan. Hieruit bleek dat het niet altijd om letter­lijke kopieën van elkaar ging, maar ook om andere gevallen.

Voor de meeste gevallen van dupli­cate content kun je op de website van Google lezen wat je hier­voor kunt doen, maar of dat voor al onze lezers even begrijpe­lijk is?

Daarom hebben wij beslo­ten een vertaal­slag voor onze lezers te maken. Zoals je van ons gewend bent, vullen wij die aan met de nodige uitleg en onze eigen erva­ringen én geven we je per oplos­sing ook nog tips over hoe je dit het beste zelf aan kunt pakken.


Wat kun je zelf doen om Google te helpen?

In geval van dupli­cate content op de eigen web­site(s), kun je Google* dus een handje helpen met het kiezen van welke versie de voor­keur heeft om getoond te worden in en door de zoek­machine. Je kunt Google helaas niet vertel­len welke content getoond moet worden.

Je kunt dit Google op verschil­len­de manie­ren laten weten. Je laat dan weten welke URL de voor­keur heeft. Deze voor­keurs-URL, wordt ook wel de cano­nieke URL genoemd. Hierop zoomen we bij oplossing 5 verder in.

Content in eigen beheer

Voor de duidelijkheid en voor we aan de slag gaan: onder­staande oplos­singen zijn vaak alleen in te zetten voor dupli­cate content op de eigen web­site of op web­sites in eigen beheer.

Het kan helaas niet worden gebruikt om plagiaat te voor­komen en gelukkig niet om in te zetten. Alle oplos­singen betreffen name­lijk hande­lingen op die versies die niet de voor­keur hebben.

* Aangezien de zoek­machine van Google met 90% van alle zoek­opdrachten veruit het grootste markt­aandeel op het gebied van zoek­machines in Nederland heeft, gaat SEO in Nederland zo goed als altijd over Google. Lees meer hier­over bij het kopje ‘SEO gaat in Nederland altijd over Google’ in ‘Hoe werken Google en andere zoekmachines’.

Let op de houdbaarheidsdatum!

Tussen moment van publicatie en wanneer jij dit leest, kunnen Google en andere zoek­machines hun waarde­rings­systeem (al)weer hebben aangepast. Houd daarom altijd rekening met deze handels­wijze en dus met de beperkte houdbaar­heid van artikelen en berichten over SEO.

 

Oplossing 1
Vermijd blokkades via robots.txt

Voor je ook maar iets doet, is het af te raden de crawlers toegang tot dubbele content te weige­ren. Het maakt niet uit of dat mid­dels een robots.txt-bestand gebeurt of met andere methoden.

Als de crawlers de pagina’s met dubbele content niet kunnen bekij­ken, kan dit ertoe leiden dat deze pagina’s door Google niet correct worden geïn­dex­eerd en gerang­schikt. Google raakt in de war door deze blok­kade en weet dus niet welke versie de voor­keur geniet. Beter kies je voor de volgende oplos­singen.

Wat is de robots.txt?

De robots.txt is een tekst­bestand dat zich op de server van een web­site bevindt. Dit bestand geeft instruc­ties aan de zoek­machines als Google. De instruc­ties gaan over welke pagina’s of delen van de web­site wel of niet mogen worden bezocht door de crawlers en dus wat wel en wat niet geïn­dex­eerd mag worden.

De robots.txt wordt vaak gebruikt om…

  • toegang tot gevoelige of onbe­lang­rijke delen van de web­site te beperken;
  • te voorkomen dat zoek­machines als Google dubbele content indexeren.

Je kunt zelf de inhoud van een robots.txt-bestand bekij­ken door naar de URL (web­adres) van het bestand te gaan. Je voegt dan achter de domein­naam robots.txt toe. Je krijgt dan bijvoor­beeld:  www.webshop.nl/robots.txt

 

Oplossing 2
Verminder of vermijd content die sterk op elkaar lijkt

Een goede volgende stap is om even tot 10 te tellen en eens kritisch te kijken naar de web­site. Staat er content op die sterk op elkaar lijkt?

Google geeft daarvoor zelf de volgende tip.

Stel je beheert een web­site met voedings­supple­men­ten en deze bevat meer­dere aparte pagina’s met content over een goede nacht­rust. Bij de ene pagina kom je via ‘magne­sium’, de andere via ‘mela­to­nine’ en de volgende via ‘vale­riaan’. En dan zijn we er nog lang niet.

Maar al deze pagina’s bevatten vrijwel dezelfde infor­matie over welke stofjes er nodig zijn om mentaal tot rust te laten komen en uiteinde­lijk lekker in slaap te vallen.

Er is geen excuus om content van de concurrent, ChatGPT of waar dan ook te kopiëren, maar laat je vooral inspireren.

Google weet dan niet welke pagina de voor­keur heeft. Je kunt deze pagina’s samen­voegen tot 1 pagina, maar wie weet heeft iedere pagina voor de conversie juist weer een andere call to action (CtA). Je wilt immers wel de mensen het product verko­pen waar ze inte­resse in hebben en even­tuele keuze­stress op het einde vooral voorkomen.

In dat geval kun je deze pagina’s beter aanpassen.


Wat kun je doen?

Pas de pagina’s met dubbele content aan door ze unie­ker te maken of kijk eens kritisch hoe dit probleem op een andere – misschien wel betere – manier op te lossen is.

Wat betekent appreciably similar?

Content kan 100% identiek zijn, maar ook ‘appre­ciably simi­lar’ in de ogen van Google. Google gebruikt deze term om te beschrij­ven dat 2 stukken content op een website veel op elkaar lijken en je kunt spreken van kleine verschil­len tussen beide.

Je kunt dan bijvoor­beeld denken aan omge­gooide woor­den en syno­nie­men binnen zinnen en aan omge­gooide zinnen binnen alinea’s. De strek­king van de content blijft hierbij min of meer hetzelfde en de gelij­ke­nis is groot. Google beschouwt derge­lijke inhoud als dupli­caat of ‘near-duplicate’ wat nega­tieve invloed ‘kan’ hebben op de zoek­resul­ta­ten van de website.

 

Oplossing 3
Wees duidelijk over duplicate content

Wanneer er sprake is van geko­pieerde content op meer­dere web­sites, toont Google moge­lijk dus niet de voor­keurs­versie. De oplos­sing hier­voor is vrij simpel.


Wat kun je doen?

 

  • Zorg dat iedere kopie een (hyper)link naar de origi­nele versie bevat.
  • Je kunt die partijen die het origi­nele mate­riaal gebrui­ken ook vragen de ‘noindex-meta­tag’ te gebrui­ken. De vraag is dan wel of ze daar­toe bereid zijn?

Wat is de noindex-metatag?

Een noindex-metatag is een HTML-tag (meta­tag) en dus een stukje code in de head-sectie van de HTML-bron­code van een speci­fieke web­pagina. Deze code laat de zoek­machines weten dat deze pagina niet geïn­dex­eerd mag worden.

Dit betekent dat de pagina niet zal worden weer­gegeven in zoek­resul­ta­ten en niet zal bijdra­gen aan de zoek­machine-opti­ma­li­sa­tie (SEO) van de web­site.

Dit kan handig zijn voor bijvoor­beeld test­pagina’s die (nog) niet bedoeld zijn voor het grote publiek en of pagina’s die alleen toegan­ke­lijk zijn via de web­site zelf. Denk hierbij aan betaal­pagina’s of pagina’s met vertrou­welijke informatie.

De tag kan ook worden inge­zet om duplicate content te voorkomen.

De noindex-metatag is dus wat anders dan de robots.txt. Beide kunnen ze wel worden gebruikt om de zoek­machines te vertel­len welke pagina’s wel of niet geïn­dex­eerd moeten worden. Alleen de robots.txt gebruiken we dus NIET om dupli­cate content te voorkomen!

Lees meer over de noindex-metatag op Google.

 

Oplossing 4
Maak gebruik van 301 redirects

Stel je verandert de indeling van de web­site en verschuift pagina’s, dan werken oude links en/of book­marks vaak niet meer. Bezoe­kers landen dan in de regel op een ‘404’.

Je kunt dan kiezen om de oude pagina’s intact te laten, want het verwijderen van deze druk­bezochte pagina’s zou eeuwig zonde zijn. Alleen, zoals we in deel 1 reeds vermeld­den, is dat abso­luut niet handig. De crawlers zien dit gewoon als dupli­cate con­tent, maar hier is dan wel einde­lijk de beloofde oplossing.

Omdat dit een veel­voor­komend probleem is, is hier­voor al jaren de oplos­sing in de vorm van 301 redirect (301‑door­verwij­zing en/of 301‑omlei­ding). Met een 301 redirect koppel je de oude URL door naar de nieuwe. Wanneer dan iemand bijvoor­beeld op een opge­sla­gen verou­der­de link klinkt, wordt deze persoon – zonder dat hij het merkt – met de 301 redirect naar de nieuwe pagina met dezelfde inhoud geleid.

Op dezelfde manier help je ook de crawlers en Google snel te bepalen wat nu de juiste content is.


Wat kun je doen?

Het inzetten van 301 redirects kun je onder andere doen door de inzet van het zogenaamde .htaccess-bestand en in WordPress met een plugin.

Omdat dit te diep gaat voor het grootste deel van onze doel­groep(en), geven we hier geen uitge­brei­de uitleg over het werken met of het aan­pas­sen van het .thaccess-bestand. Als het fout gaat zit je met je handen in het haar.

We raden je aan dit te laten regelen door de web-developer en/of app-developer (m/v/x) van de web­site of dit eerst met deze partij af te stemmen. Uiter­aard kunnen wij ook hierbij helpen.

WordPress en andere CMS’en

Voor WordPress-gebruikers is er een eenvoudigere oplos­sing, want er zijn verschil­lende gebruiks­vriendelijke plugins beschik­baar voor het instel­len van 301 redirects. Hier­voor hoef je dan niet zelf de code in te duiken.

Voor andere grote bekende CMS-plat­formen als Drupal, Joomla, Magento, Shopify, Squarespace, et cetera, zijn er ook voor het instel­len van 301 redirects diverse uitbrei­dingen (extensies, modules, plugins) beschikbaar.

Je kunt deze uitbrei­dingen zelf vaak instal­leren, maar wellicht is het geen over­bodig luxe om dit toch even te over­leg­gen met de developer. We raden dat wel aan.

Wat is een .htaccess-bestand?

Een .htaccess-bestand is een bestand dat zich meestal in de hoofd­map van de web­site bevindt. Hiermee kunnen eige­na­ren en beheer­ders van web­sites diverse zaken inre­ge­len, waar­onder de 301 redirects (301‑door­ver­wij­zing en/of 301‑omleiding).

 

Oplossing 5
Zet de canonical tag in

Om Google te helpen begrij­pen welke versie de origi­nele is en welke het dupli­caat, gaat de voor­keur uit naar de inzet van de canonical tag. Hiermee vertel je Google dat de pagina niet de origi­nele of favoriete versie is en deze als dupli­caat te beschou­wen.

Zo help je de kunstmatige intelligentie (AI) van de zoek­machine om te bepa­len welke versie in de zoek­resul­ta­ten de voor­keur heeft om te tonen, maar dit is nog steeds geen volle­dige garan­tie dat het goed gaat.

Het is aan te raden naast de cano­ni­cal tag ook een (hyper)link in te zetten en ook zo van het dupli­caat naar het origi­neel te wijzen. Máár de aller­beste oplos­sing blijft toch unieke content en die zal ook eerder bijdra­gen aan een betere bezoe­kers­beleving en -ervaring.


Wat kun je doen?

In de box leggen we je uit hoe deze tag te plaatsen.

Wat is de canonical tag?

Een canonical tag is (ook) een HTML-tag (meta­tag) en dus een stukje code in de head-sectie van de HTML-bron­code van een speci­fieke web­pagina. Het gaat dan om de web­pagina die niet de voor­keur geniet om getoond te worden in Google en dus in prin­cipe om het duplicaat.

Deze tag bevat wel de URL van de origi­nele versie of de versie die de voor­keur geniet; de versie die Google moet indexeren.

Wanneer de crawlers een cano­ni­cal tag aan het begin van een pagina tegen­komen, stoppen ze met die pagina in­dex­eren en volgen ze de URL die daarin is opge­nomen. Zo vinden ze dan de juiste versie en zullen deze – waar­schijn­lijk – indexeren.

Met de inzet van de cano­ni­cal tag laat je Google de volgende 3 belang­rijke punten zeer duide­lijk weten:

  1. Je weet dat het bij deze pagina om dupli­cate-content gaat (het is geen vergis­sing of slordig­heid).
  2. Deze pagina mag niet geïn­dex­eerd worden.
  3. Welke versie wel geïn­dex­eerd mag worden.

Hoe plaats je een canonical tag?

De canonical tag moet dus worden geplaatst in de head-sectie van de HTML van de pagina die NIET moet worden geïn­dex­eerd en ziet er als volgt uit:

<link rel=”canonical” href=”https://www.voorbeeld.nl/pagina-voorkeur-versie”>

Op de pagina van de voor­keur hoef je in prin­cipe niets extra’s te zetten.

Wat is canoniek?

De term canoniek is afge­leid van het woord canon. Canon bete­kent regel of maat­staf. De term wordt vaak gebruikt in de context van zoek­machine-opti­ma­li­sa­tie (SEO), maar ook in andere vak­gebieden als theo­logie, litera­tuur, muziek en wis­kunde kom je hem tegen. Cano­niek verwijst dan vaak naar de offi­ciële, belang­rijkste, invloed­rijkste, meest bruik­bare variant van datgene dat er in dat vak­gebied toe doet.

Binnen ons vak­gebied verwijst en in de context van dupli­cate content verwijst cano­niek naar de oor­spronke­lijke of juiste versie van een web­pagina waarbij alle andere versies als dupli­caat worden beschouwd.

Een canonieke URL (web­adres) is dus de juiste URL van een web­pagina die de zoek­machines bij voor­keur moeten gebruiken om de content te index­eren en te rang­schikken. Dit wordt door web­sites aange­geven met behulp van de cano­ni­cal tag.

 

Overige oplossingen
Wat kun je verder doen?

De volgende oplos­singen zijn minder inge­wik­keld en minder ingrij­pend, maar lees ze wel door en zet in wat je in kunt zetten. Maak het Google en bezoe­kers altijd zo eenvoudig mogelijk!

 

  • Wees consis­tent – Interne links die dan weer naar  www. , naar  http:  en dan weer naar  https:  verwij­zen, zijn niet handig. Kies steeds voor dezelfde manier van linken.
  • Gebruik hoofd­domei­nen – Bij grote bedrij­ven zie je vaak dat voor ieder land een eigen web­site is inge­richt (om het voor hier simpel te houden). In de URL zie je dan bijvoor­beeld vaak ergens  nl  staan. In dat geval kun je Google helpen door land­speci­fieke content heel duide­lijk aan te bieden. Google geeft bijvoor­beeld de voor­keur aan  http://www.voorbeeld.nl  boven  http://www.voorbeeld.com/nl  en  http://nl.voorbeeld.com .
  • Vermijd herhaalde teksten – Probeer het herhalen van steeds dezelfde teksten te voor­komen. Plaats zo’n tekst liever 1 x en verwijs daar steeds naar. Je kunt ook de tekst inkor­ten en verwij­zen naar de volledige versie.
  • Publiceer geen lege pagina’s – Soms lijkt het handig om alvast een lege pagina te publi­ceren. Een vaak gebruikte reden hier­voor is dat je dan alvast de juiste linkjes kunt toevoegen op andere pagina’s, maar dit wordt afgeraden. Doe je het toch, gebruik dan ‘tijdelijk’ de noindex-metatag.
  • Weet wat je doet – Het is belang­rijk dat je begrijpt waarmee je de web­site beheert, hoe deze werkt en wat er gebeurt met de content die je publi­ceert. Er zijn web­sites waar je maar 1 x content hoeft te publi­ceren en deze op meer­dere plek­ken wordt getoond. Opeens staat deze content dan bijvoor­beeld op de home­page, op de archief-pagina én op een categorie-pagina. Dat Google nu de weg kwijt­raakt, hoeven we vast niet verder uit te leggen.
  • Help de printerversie – Is er een normale versie en een printer­versie? Wanneer je de normale versie de voor­keur geeft, blokkeer dan de printer­versie met een noindex-metatag. En anders doe je het precies andersom.

 

Aan de slag

Het is duidelijk: met zinnen herschrij­ven voor­kom je geen dupli­cate content, dus die moeite kun je jezelf bespa­ren. Dit soort content doet eerder kwaad dan goed.

Beter ga je direct aan de slag met de boven­staande oplos­singen. En vergeet je natuur­lijk nooit dat unieke rele­vante content niet voor niets beter scoort, dan andere content.

Het blijft daarom belang­rijk te zorgen voor content die op iedere pagina van de web­site uniek is en van hoge kwali­teit is. Dit gaat je het beste helpen om de pagina’s en de web­site hoger te laten ranken in de zoek­resultaten.

Wat kun je in de toekomst doen?

Wat je voor goede rankende content kunt doen? Daarop zoomen we de komende maan­den uitge­breid in en sowieso staat goede content centraal in ons blog.

Voor nu veel succes en plezier met het sleutelen aan de dupli­cate content.

Wil je deze blogartikelen niet missen? Dan is het geen slecht idee om je onder­aan – voor­bij de onder­staande box – even aan te melden voor de gratis e‑mailalert. Tenminste, als je dat nóg niet gedaan hebt. Je ontvangt dan van ons een melding wanneer er een nieuw artikel online staat.

Zo mis je niets en zien we jou hier binnen­kort weer terug. Tot gauw!

Wij helpen

Op het gebied van content-marke­ting, zake­lijk bloggen, SEO, conversie én mensen verbin­den aan het merk zijn wij een van de weinige specia­lis­ten in regio Den Haag. In deze regio ligt ons hart, net als bij ons vak.

Wij kunnen je dus ook helpen met dupli­cate content te voor­komen, bestaande proble­men hier­mee op te los­sen of voor de toekomst hier­voor de beste werk­wijze uit te zetten. En we leve­ren natuur­lijk altijd maatwerk.

Je kunt ons bereiken via: 070 - 381 91 81. Bij geen gehoor mag je mij ook direct bellen op: 06 - 36 07 70 61.


Over de auteur
Nancy Moorman

Nancy Moorman - Content creator, merkenbouwer & conceptor

Nancy Moorman noemt zichzelf het liefst ‘gewoon’ content­maker of merken­bouwer, maar dit dekt niet de lading van wat ze onze klanten biedt. Ze zit al jaren in het vak en is door haar karak­ter zeer breed onder­legd en altijd even toege­wijd. Nancy begon ooit als werk­tekenaar, maar schoolde al snel bij tot copy­writer.
Daarna deed de Mac zijn intrede in de grafische wereld en Nancy verkende als een van de eersten de mogelijk­heden. Dat doet ze eigen­lijk met alles dat met haar vak­gebied te maken heeft. Voor onze klanten kijkt ze ook altijd naar de beste oplos­singen en ze is zeker niet wars van inno­vaties. Geen detail verliest ze hierbij uit het oog en… wat beter kan, kan beter!

 

Mis nooit meer een artikel met onze gratis e‑mailalert

Wil jij op de hoogte blijven van het laatste nieuws, de trends, tips en andere interes­sante infor­ma­tie op het gebied van zake­lijk bloggen, content-marke­ting, con­versie-opti­ma­li­sa­tie, branding, SEO en alles daar­omheen? Meld je dan direct even aan voor onze gratis e‑mailalert.

Ook wij gaan vertrouwelijk om met persoonsgegevens.



<< Direct terug naar home