Duplicate content

Zo ga je om met duplicate content

Raymond Luijbregts Contentmarketing

Duplicate content: de gemiddelde contentmarketeer heeft er een broertje dood aan. Toch staat het web er vol mee. Volgens een schatting van Matt Cutts van Google is zo’n 30 procent van alle content op het web ‘dubbel’. Meestal gaat het om specificaties of productbeschrijvingen. Wat dat laatste betreft: veel webshops kopen die tekstjes centraal in en dat geeft natuurlijk veel doublures. En ook bijvoorbeeld pers- en ANP-berichten die ongewijzigd worden overgenomen vallen onder de noemer duplicate content. Maar denk ook aan versies van webpagina’s die geschikt zijn gemaakt voor het maken van een printje.

Wat is duplicate content?

Wat valt nu precies wel en niet onder die noemer? Een lang artikel met slechts een paar overgenomen zinnen, is nog geen duplicate content. Een harde omschrijving is er niet, maar volgens Google’s richtlijnen moet het gaan om pagina’s waarvan een ‘substantieel deel dezelfde inhoud bevat’. Zie hieronder de uitleg van Matt Cutts van Google.

Is duplicate content schadelijk?

Hier bestaan veel misverstanden over. De vraag kun je met zowel ja als nee beantwoorden. Het is in ieder geval niet ‘schadelijk voor je SEO’, zoals sommigen wel eens beweren. Staat op jouw website veel dezelfde content of kopieer je van anderen, dan pleeg je hooguit plagiaat. Google straft je daarvoor niet.

Wat is er dan wel aan de hand? Duplicate content brengt zoekmachines enigszins in verwarring. Want het indexeert maar één van de pagina’s met dubbele inhoud. De kopieën worden of helemaal niet of veel lager geïndexeerd. Komt een zoekmachine duplicate content tegen, op je eigen site of dat van een ander, dan moet het immers bepalen welke van de versies de ‘originele’ is en recht heeft op het hoogste plekje in de zoekindex.

Zeker als je op je eigen website dubbele content plaatst, wil je zelf in de hand houden welke pagina dat moet zijn. Zo voorkom je bovendien dat Google SEO-waarde moet verdelen over meerdere pagina’s.

Het helpen van zoekmachines is ook belangrijk als je content van andere sites overneemt. Als je bijvoorbeeld een artikel (met toestemming en bronvermelding uiteraard) overneemt van een andere website, dan is het wel zo netjes om de zoekmachine niet om de tuin te leiden. Ere wie ere toekomt.

Kortom: er zijn genoeg redenen om zoekmachines een handje te helpen als zij duplicate content tegenkomen. Dat kan op de volgende manieren.

1) Canonical-tag

Met deze ‘tag’ geef je zoekmachines een ondubbelzinnige aanwijzing richting het origineel. De tag ziet er zo uit:

 <link href="http://www.naamvandesite.nl/naamvandeoriginelepagina" rel="canonical" />

Let wel op: het heeft geen zin deze code via de editor van je CMS in de pagina te zetten. Deze tag moet namelijk in de head-sectie van de html geplaatst worden, dus tussen de tags. Dat kan alleen je webbeheerder, of via een plugin van je CMS-systeem. Draait je site op WordPress, dan kun je bijvoorbeeld de bekende Yoast-plugin hiervoor gebruiken.

2) 301-redirect

Een 301-redirect is een vrij rigoureuze maatregel. Je stuurt hiermee niet alleen zoekmachines, maar ook daadwerkelijke bezoekers linea recta naar de pagina waarnaar je verwijst. Als webredacteur heb je niet altijd de juiste rechten voor het aanmaken van deze verwijzingen. Dat is misschien maar goed ook, want een wildgroei van verwijzingen is schadelijk voor de SEO van de gehele website. 301-redirects komen de snelheid van je website namelijk niet ten goede. Ga maar na: iedere keer moet de browser de pagina met de verwijzing laden, vervolgens de verwijzing volgen en tenslotte de doelpagina inladen. En dat is uiteindelijk niet alleen schadelijk voor de gebruikservaring van je bezoeker, maar ook voor je ranking in zoekmachines.

3)Noindex, follow

Een variant op de canonical-tag is de ‘Noindex, follow-methode’. Deze tag plaats je net als de canonical-tag in de head-sectie van de html. De tag vertelt zoekmachines dat ze de gehele pagina moeten overslaan en dus niet moeten indexeren, maar de links in die pagina wel moeten volgen. Je verwijst hiermee niet naar het origineel, maar zegt alleen tegen de zoekmachine: niets met deze pagina doen! Verander je follow in nofollow, dan verbied je de zoekmachine bovendien de links in de pagina te volgen. De tag ziet er zo uit:

 <meta name="robots" content="noxindex, follow" />