Duplicate Content wird auch als DC abgekürzt und bedeutet so viel wie „doppelter Inhalt“. Gemeint sind damit Inhalte, die im Internet auf unterschiedlichen Seiten mehrfach vorkommen. Nicht immer handelt es sich dabei ausschließlich um kopierte Texte, sondern am häufigsten um Einzelseiten, die komplett identisch sind. Es gibt einen Unterschied zwischen externem und internen Duplicate Content. Interner Duplicate Content meint, dass auf ein und der selben Internetseite, die gleichen Inhalte zu finden sind. Externer DC ist dagegen, wenn auf mehreren unterschiedlichen Internetseiten die gleichen Inhalte zu finden sind.
Für die Suchmaschinen wie beispielsweise Google stellt der Duplicate Content ein Problem dar. Deshalb wird dieser durch ein schlechteres Ranking der betreffenden Seite innerhalb der Suchmaschine abgestraft oder wird aus der Suche komplett ausgeschlossen. Damit wegen des Duplicate Contents keine Probleme mit der Platzierung in den Suchmaschinen entstehen, muss jede Seite, die indexiert ist, über ausreichenden, einzigartigen Content verfügen. Diese werden auch als Unique Content bezeichnet. Die Inhalte sind dann lediglich auf einer Seite einzigartig vertreten.

Das Problem des Duplicate Content
Der Bot von Google wertet Duplicate Content als negativ. Wenn auf einer Domain zu viel davon gefunden wird, wird das Ranking entsprechend zurückgesetzt, um den DC abzustrafen.
Innerhalb von SEO, der Suchmaschinenoptimierung einer Internetseite, spielt das Thema Duplicate Content eine große Rolle. Die SEO Bemühungen können durch dieses System massiv geschädigt werden. Denn der Algorithmus kann dann nicht mehr beurteilen, welche Domain den relevantesten Inhalt für eine Suche bietet. Außerdem sollen bei dem Crawling von Google Ressourcen sparsam eingesetzt werden. Es verschwendet allerdings Hardwareleistung und viel Geld, wenn sehr viele unterschiedliche Versionen der selben Seite vorhanden sind.
Wann wird Duplicate Content zum Problem?
Duplicate Content verursacht vor allem dann ein wirkliches Problem, wenn Google die Entscheidung nicht treffen kann, welche Seite mit dem gleichen Inhalt nun die relevante ist. Im Ranking wechseln sich dann mehrere Seiten ein. Grundsätzlich kann davon ausgegangen werden, dass ein Problem entsteht, wenn eine Seite über die Hälfte aus doppelten Inhalten besteht – spätestens. Die optimale Seite im Sinne von SEO besteht ausschließlich aus einzigartigem Content.
Wie kann Duplicate Content gefunden werden?
Am einfachsten ist es, nach den relevanten Textbausteinen zu googeln, um DC auf einer Seite aufzuspüren. Dafür müssen die Textbausteine nur in Anführungszeichen gesetzt werden. Danach muss noch auf den entsprechenden Link geklickt werden, damit die doppelten Seiten, die im Vorfeld herausgefiltert wurden, angezeigt werden.
Natürlich ist es ziemlich umständlich, alle Textbausteine in Eigenregie in die Suchmaschine einzugeben. Deswegen gibt es dafür praktische Werkzeuge. Beispielsweise ist der Report „Indexabdeckung“ in der Google Search Console enthalten. Hier müssen dann die „Ausgeschlossenen“ angewählt werden. Danach werden im unteren Bereich verschiedene Typen angezeigt, die Google als ein URL-Duplikat eingestuft hat. Wird die jeweilige URL angeklickt, öffnet sich ein Menü, über das direkt das Prüfungs-Tool ausgewählt werden kann. Danach wird angezeigt, bei welcher URL es sich um das Duplikat handelt.
Mit Werkzeugen für die On-Page Optimierung, zum Beispiel mit Ryte“, kann Duplicate Content ebenfalls gefunden werden. Ryte nimmt eine Unterscheidung in komplett doppelte Seiten, also Duplikate vor, und ähnliche Seiten, also dem „Near Duplicate Content“. Diese können sogar gefährlicher sein, da diese oft unbewusst entstanden sind und nicht direkt von Google als Duplikate aussortiert werden.
Das Vermeiden von Duplicate Content
Es gibt unterschiedliche Ansätze, um Duplicate Content zu vermeiden. Der beste ist natürlich, die bloße Entstehung von Duplicate Content zu verhindern. Beginnen tut dies bei einer sauberen Steuerung des Crawlings. Doppelte Inhalte sollten also gar nicht erst verlinkt werden.
Wenn der Duplicate Content bereits besteht, sollte eine 301-Weiterleitung genutzt werden, damit direkt eine Weiterleitung auf die originale URL eingerichtet wird. So bleibt die Internetseite sauber und schlank.
Es gibt allerdings auch DC, der einen Nutzen für die Besucher einer Webseite hat. Dies sind zum Beispiel URLs mit Produktvarianten, Affiliate-URLs oder Sortierungsoptionen. Diese Seiten müssen über einen Canonical-Link auf die originale URL verweisen. Durch diesen Link, der für die Nutzer nicht sichtbar ist, wird der Suchmaschine mitgeteilt, welche der Seiten in den Ergebnissen der Suche angezeigt werden soll. Die doppelte URL kann so von Google & Co. verstanden und die originale URL als relevant eingestuft werden.
Wenn doppelte Inhalte bestehen, die im Index Überhaupt nicht auftauchen sollten, wie beispielsweise Verteilerseiten, die sich sehr ähnlich sind und ausschließlich der Navigation nutzen, dann sollten diese über den Meta-Tag „noindex follow“ aus den Suchergebnissen ausgeschlossen werden. Allerdings ist es noch optimaler, wenn die Seitenexistenz im Allgemeinen hinterfragt wird.
Soll der DC bei der Suche beide der doppelten Inhalte anzeigen, kommt man nicht darum herum, die einzelnen Inhalte individuell zu gestalten. Sollen die Leistungen unabhängig voneinander gefunden werden, dann muss der Inhalt jeweils eigenständig formuliert werden. Selbstverständlich gilt dies auch bei den Beschreibungen der Produkte in Online-Shops.