Der Begriff doppelten Inhalt, oder doppelten Inhalt kommt von SEO. Doppelter Inhalt wird erstellt, wenn auf denselben Inhalt mit unterschiedlichen URLs zugegriffen werden kann und mit unterschiedlichen URLs indiziert wird. Die Indizierung von Websites mit doppeltem Inhalt kann eine haben Negativer Effekt in der Rangliste in den SERPs.
Arten von doppelten Inhalten
Doppelter Inhalt kann entstehen, wenn:
- Inhalte werden illegal syndiziert, verkauft oder kopiert, sodass verschiedene Websites denselben Inhalt verwenden. In diesem Fall kann der doppelte Inhalt schade dem Schöpfer.
- Der Inhalt eines Webportals wird versehentlich in verschiedenen Domains oder Subdomains angezeigt (z. B. ohne "www").
- Der Inhalt wird zweimal in verschiedenen Kategorien verwendet. Dies kann passieren, wenn der Inhalt einer URL in einem Newsfeed veröffentlicht wird.
- Das Content-Management-System kann Inhalten keine eindeutigen URLs zuweisen.
- Verschiedene Attributfilter in Online-Shops bieten dieselben Produktlisten.
Das fast doppelter Inhalt Es ist ein sehr ähnlicher Inhalt, der auch zu Problemen führen kann. Textblöcke, die häufig kopiert werden (z. B. wiederkehrende Teaser oder Texte auf jeder Seite), können von Suchmaschinen als doppelter Inhalt gerendert werden.
Hintergrund
Google] hat mehrere Anpassungen an seinen Algorithmen vorgenommen, um sicherzustellen, dass die Suchmaschine doppelte Inhalte sehr gut herausfiltern kann. Sowohl das Brandy Update 2004 als auch das Bourbon Update 2005 verbesserten die Fähigkeit von Google, doppelte Inhalte zu erkennen.
Folgen von doppeltem Inhalt
Doppelte Inhalte stellen eine Straßensperre für Suchmaschinen dar. Sie müssen auswählen, welche der doppelten Seiten für eine Suchabfrage am relevantesten ist. Google betont, dass "die Vervielfältigung von Inhalten auf einem Webportal […] kein Grund ist, gegen dieses Webportal vorzugehen". Unabhängig davon behält sich der Suchmaschinenanbieter das Recht vor, Strafen für manipulative Absichten zu verhängen: "In den seltenen Fällen, in denen wir davon ausgehen müssen, dass doppelte Inhalte angezeigt werden, um die Positionierung zu manipulieren oder unsere Benutzer irrezuführen, nehmen wir die entsprechenden Korrekturen am Index vor und Ranking der betreffenden Websites ». Die Webmaster Sie sollten Google nicht entscheiden lassen wenn der doppelte Inhalt versehentlich oder absichtlich erstellt wurde; Grundsätzlich sollten sie doppelte Inhalte vermeiden.
Technische Ursachen für doppelten Inhalt
Doppelte Inhalte können verschiedene Ursachen haben, die häufig auf einer Fehlkonfiguration der Server beruhen.
Inhaltsduplizierung aufgrund einer schlechten Serverkonfiguration
Die Argumente zur Vermeidung von doppelten Inhalten im Webportal selbst finden Sie in der Serverkonfiguration. Die folgenden Probleme können leicht gelöst werden:
Doppelter Inhalt aufgrund einer Catch-All / Wildcards-Subdomain
Einer der grundlegendsten SEO-Fehler einer Seite tritt auf, wenn eine Domain gleichzeitig auf alle Subdomains reagiert. Dies kann leicht durch einen Besuch im Grunde getestet werden
«H.
"http://www.DOMINIO.com" gefolgt von "http://domain.com" (dh ohne "www")
Wenn in beiden Fällen derselbe Inhalt angezeigt wird (und die Adressleiste weiterhin die eingegebene Domain anzeigt), handeln Sie schnell. Im schlimmsten Fall reagiert der Server auf alle Subdomains, einschließlich einer Subdomain wie
"Http://potatoe.DOMINIO.com"
Diese anderen Seiten mit demselben Inhalt werden als Doppelseiten bezeichnet. Damit Suchmaschinen leichter entscheiden können, welche URL relevant ist, muss der Server korrekt konfiguriert sein. Dies kann beispielsweise mithilfe des Mod-Rewrite-Moduls für den häufig verwendeten Apache-Server erfolgen. Mit einer .htaccess-Datei im Stammverzeichnis des Webportals kann dem Server der folgende Code mithilfe einer 301-Umleitung beigebracht werden, um sicherzustellen, dass das Webportal nur auf die richtige Domain reagiert - und allgemeine Subdomains automatisch an die richtige Domain umleitet:
RewriteEngine On #! Bitte denken Sie daran, „DOMAIN2“ durch die jeweilige Domain Ihres Projekts zu ersetzen! RewriteCond % {HTTP_HOST}! ^ Www.DOMAIN.com$ [NC] RewriteRule (. *) Http://www.DOMAIN.com/$1 [R = 301, L]
Als vorläufige Überlegung sollte man zuerst wählen, was das sein soll Hauptdomäne - also mit oder ohne "www"? Bei internationalen Websites sollte die Länder-ID auch als Subdomain betrachtet werden.
http://en.DOMAIN.com/
Doppelter Inhalt aufgrund fehlender Balken
Eine andere weit verbreitete Form von doppeltem Inhalt ergibt sich aus der Verwendung von Schrägstrichen. Dies sind URLs, die keine Dateinamen enthalten, sondern auf Verzeichnisse verweisen. Zum Beispiel:
http://www.DOMAIN.com/register_a/register_b/
Dies öffnet (normalerweise) die Indexdatei im Unterordner "register_b". Abhängig von der Konfiguration reagiert auch die nächste URL ähnlich:
http://www.DOMAIN.com/register_a/register_b
Im obigen Beispiel fehlt der letzte Schrägstrich. Der Server versucht zunächst, die nicht vorhandene Datei "register_b" zu finden, stellt jedoch später fest, dass ein solcher Ordner vorhanden ist. Da der Server keine unnötige Fehlermeldung zurückgeben möchte ("Datei existiert nicht"), wird die Indexdatei für diesen Ordner angezeigt. Im Prinzip ist dies eine gute Sache, aber leider führt dies zu doppelten Inhalten (sobald ein Link auf eine "gefälschte" URL verweist). Dieses Problem kann auf verschiedene Arten behandelt werden:
- 301 Mit .htaccess umleiten.
- Kanonisches Tag, das auf die richtige URL verweist.
- Blockieren durch robots.txt.
- Korrektur aller falsch geschriebenen Links (schwierig für eingehende Links).
Der beste Weg, dies zu tun, ist die Verwendung einer 301-Umleitung über .htaccess sowie die Behebung fehlerhafter Links. Dies erspart Google unnötige Probleme beim Crawlen, die wiederum an einem anderen Punkt für das Webportal von Vorteil sein können.
Behandlung von doppelten Inhalten
Die Aufgabe der Optimierung einer Seite besteht nicht nur darin, Doppelinhalte zu vermeiden, sondern diese auch zu identifizieren und angemessen zu handeln. Hier kann der sogenannte Duplicate Content Checker helfen. Listen Sie die URLs auf, die ähnlichen Inhalt anzeigen. Es ist besonders wichtig, dass Webmaster und SEOs bei doppelten Inhalten angemessen handeln. Da die Indizierung in Suchmaschinen-Bots immer schneller ist, gelangen ähnliche Inhalte auch schneller ins Web. Dies führt zu dem Risiko von a Fehlklassifizierung oder sogar ein beschleunigter Ausschluss aus dem Index.
Einzigartigkeit des Textes
Doppelte Inhalte wirken sich häufig auf Online-Shops aus, die 1: 1-Produkttexte von Herstellern übernehmen und diese auch für Preisvergleichsportale verwenden. Matt Cutts hat diesbezüglich bereits seine Meinung geäußert. [1] Auf diese Weise müssen Sie unterschiedliche Texte für Ihre eigene Homepage und Preisvergleiche oder externe Shopping-Portale erstellen. Auch wenn es eine mühsame Aufgabe zu sein scheint, lohnen sich individualisierte Texte für verschiedene Seiten - erstens werden Ihre eigene Website und Ihre Marke gestärkt, und zweitens erhalten die Preisvergleiche individualisierte und damit interessantere Texte sowohl für Google als auch für für den Benutzer.
Um Doppelungen von Online-Inhalten auf der Website selbst zu vermeiden, sollten Webmaster deren Inhalte sorgfältig prüfen und möglicherweise berücksichtigen wenn einige Kategorien zusammengeführt werden können. In einigen Fällen kann es auch nützlich sein, Filterseiten beispielsweise mit dem Tag "noindex, follow" zu markieren. Suchmaschinen indizieren diese Seiten nicht, sondern folgen den auf ihnen angezeigten Links.
Um eindeutige Inhalte zu erstellen, stehen Tools zur Verfügung, die die TF * IDF-Formel berücksichtigen.
Diebstahl Inhalt
Im Falle einer Vervielfältigung externer Inhalte infolge von "Inhaltsdiebstahl" sollten Sie sich unverzüglich an den jeweiligen Webmaster wenden und dies anfordern Geben Sie die ursprüngliche Quelle des Textes an oder löschen Sie den Text. In den meisten Fällen reicht eine einfache Anfrage aus. Zusätzlich kann in extremen Fällen eine Warnung ausgegeben werden. Gleichzeitig haben Webmaster die Möglichkeit, Google-Seiten, die gegen das Urheberrecht verstoßen, durch Kopieren von Inhalten Bericht zu erstatten. Dieses Formular kann über die Google Search Console gesendet werden.
301 umleiten
Wenn externer doppelter Inhalt auftritt, weil ein Webmaster zwei Websites mit demselben Inhalt auf zwei oder mehr Domains betreibt, reicht häufig eine 301-Weiterleitung aus, um doppelten Inhalt zu verhindern.
Eine andere Alternative besteht darin, Google beispielsweise über die Google Search Console über die bevorzugte Version eines Webportals zu informieren.
Kanonisches Tag, Noindex-Tag und robots.txt
Es gibt verschiedene Alternativen, wenn es aus doppelten internen Inhalten im Webportal selbst besteht. Das kanonische Tag ist unter diesen Umständen ein wichtiges Werkzeug. Dies bezieht sich auf die Unterseite auf Originalseite dupliziertund das Duplikat ist von der Indizierung ausgenommen. Wenn Sie vollständig sicher sein müssen, dass eine Unterseite mit doppeltem Inhalt nicht indiziert ist, können Sie sie mit einem noindex-Tag als Lesezeichen speichern. Um doppelten Inhalt weiter vom Crawlen auszuschließen, können die entsprechenden Unterseiten auch in der Datei robots.txt gespeichert werden.
Hreflang-Tags auf übersetzten Seiten
Jetzt kann Google die übersetzten Seiten gut identifizieren und Weisen Sie einer Originalseite Inhalt zu. Um Doppelarbeit von Inhalten durch identische Übersetzungen oder Sprachen für verschiedene Zielmärkte zu vermeiden, kann das Tag verwendet werden Geben Sie die Region und Sprache der einzelnen URLs an. Auf diese Weise erkennt Google, dass es Übersetzungen einer Seite gibt und dass die URL eine bestimmte Ausrichtung hat.
Ein Beispiel: Ein deutscher Online-Shop bietet seine Produkte auch im deutschsprachigen Raum der Schweiz und in Österreich an. In diesem Fall ist die Zielsprache Deutsch. Unabhängig davon verwendet das Geschäft das jeweilige Land, das in und für die Zielländer endet. Um Doppelarbeit zu vermeiden, wird diese in die Kopfzeile der deutschen Fassung eingefügt, um auf eine Variante für die Schweiz zu verweisen.
Rel = Alternative mit mobilen Subdomains =
Die Smartphone-Optimierung kann auch doppelte Inhalte erzeugen. Dies gilt grundsätzlich, wenn das Smartphone-Webportal über eine eigene Subdomain verfügt. Doppelter Inhalt kann durch Verwendung des Tags rel = alternative vermieden werden. Das Etikett bezieht sich von der Desktop-Version auf die Smartphone-Version. Suchmaschinen erkennen dann, dass die Domain dieselbe ist und Vermeiden Sie Doppelindizierungen.
Verhütung
Um doppelte interne Inhalte zu vermeiden, empfiehlt es sich, die Seitenhierarchie entsprechend zu planen. Dies ermöglicht eine frühzeitige Erkennung mögliche Quellen für doppelten Inhalt. Bei der Erstellung von Produkten in Online-Shops müssen zusätzliche Vorbereitungen für die einfache Implementierung kanonischer Tags getroffen werden. Für die Textebene gilt Folgendes: Je individueller der Text ist, desto besser ist er für Google und den Nutzer und desto einfacher ist es, doppelte Inhalte zu vermeiden.
Doppelte Inhaltsprüfung
Für die erste Analyse wird der sogenannte Duplicate Content Checker aktiviert, z. B. von Copyscape oder Ryte. Diese Tools identifizieren zunächst ähnliche oder sogar identische Inhalte im Web. Insbesondere Online-Shops, die ihre Produktdaten über CSV-Dateien an Preisvergleichsportale oder Verkaufsplattformen wie Amazon übertragen, sind häufig von diesen Problemen betroffen. Matt Cutts hat diesbezüglich bereits seine Meinung geäußert. [2]
Web-Links
- Google Support: Doppelte Inhalte
- Video von Matt Cutts: Wenn ich eine andere Quelle zitiere, werde ich für doppelten Inhalt bestraft?