Duplicate content en bloggen • 2/2 • Oplossingen voor de SEO [checklist]
Wanneer je te maken hebt met duplicate content, betekent dit vaak dat er meerdere pagina’s met dezelfde content op de website staan. Voor Google kan dit verwarrend zijn, want welke pagina moet de zoekmachine nou weergeven in de resultaten?
Maar maak je geen zorgen, er zijn oplossingen voor dit probleem! In dit blogartikel zoomen we aan de hand van een checklist in op de oplossingen en vertellen we hoe je Google op weg helpt met de juiste versie te kiezen. Zo zorg je dat jouw favoriete content toch goed scoort in de zoekmachine!
Gaat het over het optimaliseren van apps, dan spreek je over ‘App Store Optimalisatie’ (ASO). Je kunt gerust verder lezen, want tussen SEO en ASO bestaan zeer veel overeenkomsten. Zeker met betrekking tot de materie in dit blogartikel. Bij uitzondering gebruiken we in dit blogartikel niet steeds ‘websites en apps’ zoals je van ons gewend bent. Dit zou de tekst niet prettiger leesbaar maken en dus kiezen we hier alleen voor het begrip website.
Wat gaan we doen?
- Deel 1 – We zoomden in op wat duplicate content is, bekeken de gevaren ervan en hoe groot die gevaren werkelijk zijn. Terug naar deel 1.
- Deel 2 – We bespreken de stappen die je kunt ondernemen om Google te helpen te begrijpen welke content de voorkeur heeft voor vertoning in de zoekmachine (en welke niet).
Eerst meer weten?
Lees dan deel 1.
Of ga naar het overzicht van alle blogartikelen over zakelijk bloggen. Als wij je op de hoogte mogen houden van nieuwe artikelen over bloggen en gerelateerde onderwerpen, meld je dan direct even aan voor de gratis e‑mailalert. Klik hier.
Inhoud
- Voor we verder gaan
- Oplossing 1 – Vermijd blokkades via robots.txt
- Oplossing 2 – Verminder of vermijd content die sterk op elkaar lijkt
- Oplossing 3 – Wees duidelijk over duplicate content
- Oplossing 4 – Maak gebruik van 301 redirects
- Oplossing 5 – Zet de canonical tag in
- Overige oplossingen – Wat kun je verder doen?
- Aan de slag
Voor we verder gaan
We begonnen deze serie met een uitleg over diverse vormen van duplicate content en hoe dit kan ontstaan. Hieruit bleek dat het niet altijd om letterlijke kopieën van elkaar ging, maar ook om andere gevallen.
Voor de meeste gevallen van duplicate content kun je op de website van Google lezen wat je hiervoor kunt doen, maar of dat voor al onze lezers even begrijpelijk is?
Daarom hebben wij besloten een vertaalslag voor onze lezers te maken. Zoals je van ons gewend bent, vullen wij die aan met de nodige uitleg en onze eigen ervaringen én geven we je per oplossing ook nog tips over hoe je dit het beste zelf aan kunt pakken.
Wat kun je zelf doen om Google te helpen?
In geval van duplicate content op de eigen website(s), kun je Google* dus een handje helpen met het kiezen van welke versie de voorkeur heeft om getoond te worden in en door de zoekmachine. Je kunt Google helaas niet vertellen welke content getoond moet worden.
Je kunt dit Google op verschillende manieren laten weten. Je laat dan weten welke URL de voorkeur heeft. Deze voorkeurs-URL, wordt ook wel de canonieke URL genoemd. Hierop zoomen we bij oplossing 5 verder in.
Content in eigen beheer
Voor de duidelijkheid en voor we aan de slag gaan: onderstaande oplossingen zijn vaak alleen in te zetten voor duplicate content op de eigen website of op websites in eigen beheer.
Het kan helaas niet worden gebruikt om plagiaat te voorkomen en gelukkig niet om in te zetten. Alle oplossingen betreffen namelijk handelingen op die versies die niet de voorkeur hebben.
* Aangezien de zoekmachine van Google met 90% van alle zoekopdrachten veruit het grootste marktaandeel op het gebied van zoekmachines in Nederland heeft, gaat SEO in Nederland zo goed als altijd over Google. Lees meer hierover bij het kopje ‘SEO gaat in Nederland altijd over Google’ in ‘Hoe werken Google en andere zoekmachines’.
Let op de houdbaarheidsdatum!
Tussen moment van publicatie en wanneer jij dit leest, kunnen Google en andere zoekmachines hun waarderingssysteem (al)weer hebben aangepast. Houd daarom altijd rekening met deze handelswijze en dus met de beperkte houdbaarheid van artikelen en berichten over SEO.
Oplossing 1
Vermijd blokkades via robots.txt
Voor je ook maar iets doet, is het af te raden de crawlers toegang tot dubbele content te weigeren. Het maakt niet uit of dat middels een robots.txt-bestand gebeurt of met andere methoden.
Als de crawlers de pagina’s met dubbele content niet kunnen bekijken, kan dit ertoe leiden dat deze pagina’s door Google niet correct worden geïndexeerd en gerangschikt. Google raakt in de war door deze blokkade en weet dus niet welke versie de voorkeur geniet. Beter kies je voor de volgende oplossingen.
Wat is de robots.txt?
De robots.txt is een tekstbestand dat zich op de server van een website bevindt. Dit bestand geeft instructies aan de zoekmachines als Google. De instructies gaan over welke pagina’s of delen van de website wel of niet mogen worden bezocht door de crawlers en dus wat wel en wat niet geïndexeerd mag worden.
De robots.txt wordt vaak gebruikt om…
- toegang tot gevoelige of onbelangrijke delen van de website te beperken;
- te voorkomen dat zoekmachines als Google dubbele content indexeren.
Je kunt zelf de inhoud van een robots.txt-bestand bekijken door naar de URL (webadres) van het bestand te gaan. Je voegt dan achter de domeinnaam robots.txt toe. Je krijgt dan bijvoorbeeld: www.webshop.nl/robots.txt
Oplossing 2
Verminder of vermijd content die sterk op elkaar lijkt
Een goede volgende stap is om even tot 10 te tellen en eens kritisch te kijken naar de website. Staat er content op die sterk op elkaar lijkt?
Google geeft daarvoor zelf de volgende tip.
Stel je beheert een website met voedingssupplementen en deze bevat meerdere aparte pagina’s met content over een goede nachtrust. Bij de ene pagina kom je via ‘magnesium’, de andere via ‘melatonine’ en de volgende via ‘valeriaan’. En dan zijn we er nog lang niet.
Maar al deze pagina’s bevatten vrijwel dezelfde informatie over welke stofjes er nodig zijn om mentaal tot rust te laten komen en uiteindelijk lekker in slaap te vallen.
Er is geen excuus om content van de concurrent, ChatGPT of waar dan ook te kopiëren, maar laat je vooral inspireren.
Google weet dan niet welke pagina de voorkeur heeft. Je kunt deze pagina’s samenvoegen tot 1 pagina, maar wie weet heeft iedere pagina voor de conversie juist weer een andere call to action (CtA). Je wilt immers wel de mensen het product verkopen waar ze interesse in hebben en eventuele keuzestress op het einde vooral voorkomen.
In dat geval kun je deze pagina’s beter aanpassen.
Wat kun je doen?
Pas de pagina’s met dubbele content aan door ze unieker te maken of kijk eens kritisch hoe dit probleem op een andere – misschien wel betere – manier op te lossen is.
Wat betekent appreciably similar?
Content kan 100% identiek zijn, maar ook ‘appreciably similar’ in de ogen van Google. Google gebruikt deze term om te beschrijven dat 2 stukken content op een website veel op elkaar lijken en je kunt spreken van kleine verschillen tussen beide.
Je kunt dan bijvoorbeeld denken aan omgegooide woorden en synoniemen binnen zinnen en aan omgegooide zinnen binnen alinea’s. De strekking van de content blijft hierbij min of meer hetzelfde en de gelijkenis is groot. Google beschouwt dergelijke inhoud als duplicaat of ‘near-duplicate’ wat negatieve invloed ‘kan’ hebben op de zoekresultaten van de website.
Oplossing 3
Wees duidelijk over duplicate content
Wanneer er sprake is van gekopieerde content op meerdere websites, toont Google mogelijk dus niet de voorkeursversie. De oplossing hiervoor is vrij simpel.
Wat kun je doen?
- Zorg dat iedere kopie een (hyper)link naar de originele versie bevat.
- Je kunt die partijen die het originele materiaal gebruiken ook vragen de ‘noindex-metatag’ te gebruiken. De vraag is dan wel of ze daartoe bereid zijn?
Wat is de noindex-metatag?
Een noindex-metatag is een HTML-tag (metatag) en dus een stukje code in de head-sectie van de HTML-broncode van een specifieke webpagina. Deze code laat de zoekmachines weten dat deze pagina niet geïndexeerd mag worden.
Dit betekent dat de pagina niet zal worden weergegeven in zoekresultaten en niet zal bijdragen aan de zoekmachine-optimalisatie (SEO) van de website.
Dit kan handig zijn voor bijvoorbeeld testpagina’s die (nog) niet bedoeld zijn voor het grote publiek en of pagina’s die alleen toegankelijk zijn via de website zelf. Denk hierbij aan betaalpagina’s of pagina’s met vertrouwelijke informatie.
De tag kan ook worden ingezet om duplicate content te voorkomen.
De noindex-metatag is dus wat anders dan de robots.txt. Beide kunnen ze wel worden gebruikt om de zoekmachines te vertellen welke pagina’s wel of niet geïndexeerd moeten worden. Alleen de robots.txt gebruiken we dus NIET om duplicate content te voorkomen!
Oplossing 4
Maak gebruik van 301 redirects
Stel je verandert de indeling van de website en verschuift pagina’s, dan werken oude links en/of bookmarks vaak niet meer. Bezoekers landen dan in de regel op een ‘404’.
Je kunt dan kiezen om de oude pagina’s intact te laten, want het verwijderen van deze drukbezochte pagina’s zou eeuwig zonde zijn. Alleen, zoals we in deel 1 reeds vermeldden, is dat absoluut niet handig. De crawlers zien dit gewoon als duplicate content, maar hier is dan wel eindelijk de beloofde oplossing.
Omdat dit een veelvoorkomend probleem is, is hiervoor al jaren de oplossing in de vorm van 301 redirect (301‑doorverwijzing en/of 301‑omleiding). Met een 301 redirect koppel je de oude URL door naar de nieuwe. Wanneer dan iemand bijvoorbeeld op een opgeslagen verouderde link klinkt, wordt deze persoon – zonder dat hij het merkt – met de 301 redirect naar de nieuwe pagina met dezelfde inhoud geleid.
Op dezelfde manier help je ook de crawlers en Google snel te bepalen wat nu de juiste content is.
Wat kun je doen?
Het inzetten van 301 redirects kun je onder andere doen door de inzet van het zogenaamde .htaccess-bestand en in WordPress met een plugin.
Omdat dit te diep gaat voor het grootste deel van onze doelgroep(en), geven we hier geen uitgebreide uitleg over het werken met of het aanpassen van het .thaccess-bestand. Als het fout gaat zit je met je handen in het haar.
We raden je aan dit te laten regelen door de web-developer en/of app-developer (m/v/x) van de website of dit eerst met deze partij af te stemmen. Uiteraard kunnen wij ook hierbij helpen.
WordPress en andere CMS’en
Voor WordPress-gebruikers is er een eenvoudigere oplossing, want er zijn verschillende gebruiksvriendelijke plugins beschikbaar voor het instellen van 301 redirects. Hiervoor hoef je dan niet zelf de code in te duiken.
Voor andere grote bekende CMS-platformen als Drupal, Joomla, Magento, Shopify, Squarespace, et cetera, zijn er ook voor het instellen van 301 redirects diverse uitbreidingen (extensies, modules, plugins) beschikbaar.
Je kunt deze uitbreidingen zelf vaak installeren, maar wellicht is het geen overbodig luxe om dit toch even te overleggen met de developer. We raden dat wel aan.
Wat is een .htaccess-bestand?
Een .htaccess-bestand is een bestand dat zich meestal in de hoofdmap van de website bevindt. Hiermee kunnen eigenaren en beheerders van websites diverse zaken inregelen, waaronder de 301 redirects (301‑doorverwijzing en/of 301‑omleiding).
Oplossing 5
Zet de canonical tag in
Om Google te helpen begrijpen welke versie de originele is en welke het duplicaat, gaat de voorkeur uit naar de inzet van de canonical tag. Hiermee vertel je Google dat de pagina niet de originele of favoriete versie is en deze als duplicaat te beschouwen.
Zo help je de kunstmatige intelligentie (AI) van de zoekmachine om te bepalen welke versie in de zoekresultaten de voorkeur heeft om te tonen, maar dit is nog steeds geen volledige garantie dat het goed gaat.
Het is aan te raden naast de canonical tag ook een (hyper)link in te zetten en ook zo van het duplicaat naar het origineel te wijzen. Máár de allerbeste oplossing blijft toch unieke content en die zal ook eerder bijdragen aan een betere bezoekersbeleving en -ervaring.
Wat kun je doen?
In de box leggen we je uit hoe deze tag te plaatsen.
Wat is de canonical tag?
Een canonical tag is (ook) een HTML-tag (metatag) en dus een stukje code in de head-sectie van de HTML-broncode van een specifieke webpagina. Het gaat dan om de webpagina die niet de voorkeur geniet om getoond te worden in Google en dus in principe om het duplicaat.
Deze tag bevat wel de URL van de originele versie of de versie die de voorkeur geniet; de versie die Google moet indexeren.
Wanneer de crawlers een canonical tag aan het begin van een pagina tegenkomen, stoppen ze met die pagina indexeren en volgen ze de URL die daarin is opgenomen. Zo vinden ze dan de juiste versie en zullen deze – waarschijnlijk – indexeren.
Met de inzet van de canonical tag laat je Google de volgende 3 belangrijke punten zeer duidelijk weten:
- Je weet dat het bij deze pagina om duplicate-content gaat (het is geen vergissing of slordigheid).
- Deze pagina mag niet geïndexeerd worden.
- Welke versie wel geïndexeerd mag worden.
Hoe plaats je een canonical tag?
De canonical tag moet dus worden geplaatst in de head-sectie van de HTML van de pagina die NIET moet worden geïndexeerd en ziet er als volgt uit:
<link rel=”canonical” href=”https://www.voorbeeld.nl/pagina-voorkeur-versie”>
Op de pagina van de voorkeur hoef je in principe niets extra’s te zetten.
Wat is canoniek?
De term canoniek is afgeleid van het woord canon. Canon betekent regel of maatstaf. De term wordt vaak gebruikt in de context van zoekmachine-optimalisatie (SEO), maar ook in andere vakgebieden als theologie, literatuur, muziek en wiskunde kom je hem tegen. Canoniek verwijst dan vaak naar de officiële, belangrijkste, invloedrijkste, meest bruikbare variant van datgene dat er in dat vakgebied toe doet.
Binnen ons vakgebied verwijst en in de context van duplicate content verwijst canoniek naar de oorspronkelijke of juiste versie van een webpagina waarbij alle andere versies als duplicaat worden beschouwd.
Een canonieke URL (webadres) is dus de juiste URL van een webpagina die de zoekmachines bij voorkeur moeten gebruiken om de content te indexeren en te rangschikken. Dit wordt door websites aangegeven met behulp van de canonical tag.
Overige oplossingen
Wat kun je verder doen?
De volgende oplossingen zijn minder ingewikkeld en minder ingrijpend, maar lees ze wel door en zet in wat je in kunt zetten. Maak het Google en bezoekers altijd zo eenvoudig mogelijk!
- Wees consistent – Interne links die dan weer naar www. , naar http: en dan weer naar https: verwijzen, zijn niet handig. Kies steeds voor dezelfde manier van linken.
- Gebruik hoofddomeinen – Bij grote bedrijven zie je vaak dat voor ieder land een eigen website is ingericht (om het voor hier simpel te houden). In de URL zie je dan bijvoorbeeld vaak ergens nl staan. In dat geval kun je Google helpen door landspecifieke content heel duidelijk aan te bieden. Google geeft bijvoorbeeld de voorkeur aan http://www.voorbeeld.nl boven http://www.voorbeeld.com/nl en http://nl.voorbeeld.com .
- Vermijd herhaalde teksten – Probeer het herhalen van steeds dezelfde teksten te voorkomen. Plaats zo’n tekst liever 1 x en verwijs daar steeds naar. Je kunt ook de tekst inkorten en verwijzen naar de volledige versie.
- Publiceer geen lege pagina’s – Soms lijkt het handig om alvast een lege pagina te publiceren. Een vaak gebruikte reden hiervoor is dat je dan alvast de juiste linkjes kunt toevoegen op andere pagina’s, maar dit wordt afgeraden. Doe je het toch, gebruik dan ‘tijdelijk’ de noindex-metatag.
- Weet wat je doet – Het is belangrijk dat je begrijpt waarmee je de website beheert, hoe deze werkt en wat er gebeurt met de content die je publiceert. Er zijn websites waar je maar 1 x content hoeft te publiceren en deze op meerdere plekken wordt getoond. Opeens staat deze content dan bijvoorbeeld op de homepage, op de archief-pagina én op een categorie-pagina. Dat Google nu de weg kwijtraakt, hoeven we vast niet verder uit te leggen.
- Help de printerversie – Is er een normale versie en een printerversie? Wanneer je de normale versie de voorkeur geeft, blokkeer dan de printerversie met een noindex-metatag. En anders doe je het precies andersom.
Aan de slag
Het is duidelijk: met zinnen herschrijven voorkom je geen duplicate content, dus die moeite kun je jezelf besparen. Dit soort content doet eerder kwaad dan goed.
Beter ga je direct aan de slag met de bovenstaande oplossingen. En vergeet je natuurlijk nooit dat unieke relevante content niet voor niets beter scoort, dan andere content.
Het blijft daarom belangrijk te zorgen voor content die op iedere pagina van de website uniek is en van hoge kwaliteit is. Dit gaat je het beste helpen om de pagina’s en de website hoger te laten ranken in de zoekresultaten.
Wat kun je in de toekomst doen?
Wat je voor goede rankende content kunt doen? Daarop zoomen we de komende maanden uitgebreid in en sowieso staat goede content centraal in ons blog.
Voor nu veel succes en plezier met het sleutelen aan de duplicate content.
Wil je deze blogartikelen niet missen? Dan is het geen slecht idee om je onderaan – voorbij de onderstaande box – even aan te melden voor de gratis e‑mailalert. Tenminste, als je dat nóg niet gedaan hebt. Je ontvangt dan van ons een melding wanneer er een nieuw artikel online staat.
Zo mis je niets en zien we jou hier binnenkort weer terug. Tot gauw!
Wij helpen
Op het gebied van content-marketing, zakelijk bloggen, SEO, conversie én mensen verbinden aan het merk zijn wij een van de weinige specialisten in regio Den Haag. In deze regio ligt ons hart, net als bij ons vak.
Wij kunnen je dus ook helpen met duplicate content te voorkomen, bestaande problemen hiermee op te lossen of voor de toekomst hiervoor de beste werkwijze uit te zetten. En we leveren natuurlijk altijd maatwerk.
Je kunt ons bereiken via: [nummer opgeheven]. Bij geen gehoor mag je mij ook direct bellen op: 06 - 36 07 70 61.
Over de auteur
Nancy Moorman
Nancy Moorman noemt zichzelf het liefst ‘gewoon’ contentmaker of merkenbouwer, maar dit dekt niet de lading van wat ze onze klanten biedt. Ze zit al jaren in het vak en is door haar karakter zeer breed onderlegd en altijd even toegewijd. Nancy begon ooit als werktekenaar, maar schoolde al snel bij tot copywriter.
Daarna deed de Mac zijn intrede in de grafische wereld en Nancy verkende als een van de eersten de mogelijkheden. Dat doet ze eigenlijk met alles. Voor onze klanten kijkt ze ook altijd naar de beste oplossingen en is daarbij dus niet wars van innovaties. Geen detail verliest ze uit het oog en… wat beter kan, kan beter!
Mis nooit meer een artikel met onze gratis e‑mailalert
Wil jij op de hoogte blijven van het laatste nieuws, de trends, tips en andere interessante informatie op het gebied van zakelijk bloggen, content-marketing, conversie-optimalisatie, branding, SEO en alles daaromheen? Meld je dan direct even aan voor onze gratis e‑mailalert.
Ook wij gaan vertrouwelijk om met persoonsgegevens.