Onpage

Was ist der Canonical Tag und wie setze ich ihn richtig ein?

So kann der Crawler Kopien vom Original unterscheiden
Anna Maria von Kentzinsky
Anna Maria von Kentzinsky | 20.02.2021

Die Suchmaschinenoptimierung hat einige Grundregeln. Eine dieser Regeln ist, dass du für jedes für dich wichtige Keyword eine Unterseite erstellst, die die Bedürfnisse der Menschen befriedigt.

Eine.

Nicht zwei, nicht drei, nicht fünf — denn das kann schnell zu Problemen führen, die Ranking- Traffic- und/oder Lead-Verlust nach sich ziehen. Doch das lässt sich nicht immer vermeiden. Was also tun? Hier kommt der Canonical Tag ins Spiel.

Hier lernst du, was der Canonical Tag ist, warum du ihn benötigst und wie du ihn richtig einsetzt. Und das inklusive praktischem Cheat Sheet zum Herunterladen am Ende des Artikels.

Was ist der Canonical Tag?

Der Canonical Tag ist ein Werkzeug der technischen Suchmaschinenoptimierung. Er wurde 2009 eingeführt. Dabei handelt es sich um ein HTML-Element, das die kanonische URL enthält. Du nutzt es um Suchmaschinen zu zeigen, welche Seite in den Index aufgenommen werden soll, wenn du URLs mit sehr ähnlichen oder gar identischen Inhalten auf deiner Website hast.

Diese kanonische URL ist also die URL der Seite, die tatsächlich ranken soll — die Seite, die für das jeweilige Keyword vorgesehen ist. Du kannst sie dir auch als das “Original” vorstellen. Alle anderen URLs wären inhaltlich zwar identisch, werden dann aber lediglich als “Kopie” deines “Originals” betrachtet und nicht indexiert. Die URL des „Originals“ wird auch kanonische URL, Canonical Link oder Canonical URL genannt.

Der Canonical Tag hilft dir also, Duplicate Content sowie Keyword-Kannibalisierung zu beheben bzw. zu vermeiden. Duplicate Content sind identische oder sehr ähnliche Inhalte. Von Keyword-Kannibalisierung spricht man, wenn zwei oder mehr URLs der eigenen Domain zum selben Keyword ranken und sich in diesen Rankings gegenseitig behindern.

Jede Seite mit einem Canonical Link vererbt dem “Original” einen Teil seiner SEO-Power. Daher ist der Canonical Tag auch ein wichtiges Werkzeug für die gezielte Stärkung einzelner Seiten.

Merke-IconDer Canonical Tag ist lediglich ein Hinweis, keine Regel für die Suchmaschinen. Es steht ihnen frei, sich nach ihm zu richten. In der Regel beachten die Suchmaschinen diesen Hinweis allerdings.

Die Vorteile des Canonical Tags:

  • Für WordPress und Yoomla sind keine Programmierkenntnisse erforderlich
  • Man kann ihn individuell für jede Seite setzen
  • Der Trust von Google wird auf eine bestimmte URL vererbt und nicht auf viele URLs aufgeteilt
  • Der Canonical Tag wird von Google, Bing und Yahoo anerkannt

Warum ist der Canonical Tag nötig?

Wie bereits angesprochen, kann es passieren, dass mehr als eine URL deiner Website zu einem Keyword rankt. In vielen Fällen (aber nicht grundsätzlich immer) führt das zu drei wesentlichen Problemen:

  1. Duplicate Content
  2. Keyword Kannibalisierung
  3. Google wählt die Canonical URL

1. Duplicate Content

Duplicate Content entsteht, wenn gleicher oder sehr ähnlicher Inhalt auf zwei oder mehreren URLs erreichbar ist. Das kann verschiedene Gründe haben, wir haben dir fünf häufige Ursachen für Duplicate Content aufgelistet:

  1. Eine Seite ist erreichbar mit und ohne www.
  2. Produkt-Varianten in Online Shops: Wenn es von einem Produkt mehrere Varianten z. B. in verschiedenen Größen oder Farben gibt, gibt es für jede mögliche Variante häufig eine eigene URL. Die Produktbeschreibung ist dann immer gleich bis auf die Angabe der unterscheidenden Merkmale wie eben die Farbe oder die Größe.
  3. Etwas ähnliches kann passieren, wenn du sehr ähnliche Landing Pages hast, zum Beispiel für dein Local SEO. Unterscheiden diese sich lediglich durch den Namen der Stadt und sind sonst identisch, kann das zu Problemen führen.
  4. Duplicate Content entsteht auch, wenn z. B. aufgrund eines Filters oder der internen Suche Parameter mit an die URL angehangen werden. Dann ist die Seite unter der eigentlichen URL erreichbar und zusätzlich über eine weitere mit Session-IDs oder Parametern.
  5. Wenn ein Artikel gleich mehreren Kategorien eines Blogs oder Online-Magazins zugeordnet wird, kann das ebenfalls zu doppelten Inhalten führen.

SEO Kompass Tipp Falls du dich tiefer in die Materie des Duplicate Content einlesen möchtest, empfehlen wir dir den Artikel “Internen Duplicate Content erkennen und vermeiden”. Lerne auch, wie du doppelten Inhalten auf die Schliche kommst und den Canonical Tag einsetzen kannst, bevor es Probleme mit der Suchmaschine gibt.

Google Search Central hat ein gut erklärtes Video über Duplicate Content erstellt:

Prävention: So entdeckst du Duplicate Content

Entdecke Duplicate Content, bevor die Suchmaschine es tut! Checke deine Website regelmäßig auf doppelte Inhalte, bevor es zu Ranking- und Trafficverlusten kommt.

Dabei hilft dir ein gutes SEO Tool. Seine Crawler erfassen deine Website und geben dir eine Liste der URLs, die sehr ähnlich oder gar identisch sind.

Diese Liste untersuchst du dann auf Originale und ihre Kopien und fügst entsprechende Canonical Tags in die Seiten ein.

2. Keyword-Kannibalisierung

Keyword-Kannibalisierung entsteht durch Duplicate Content oder durch zwei (oder mehr) URLs derselben Domain, die ähnliche Inhalte haben. Die Suchmaschine stuft dann all diese URLs als (unterschiedlich aber ähnlich) relevant für dasselbe Keyword ein.

Um herauszufinden, welcher dieser Inhalte der relevanteste für die Suchanfrage ist, führt die Suchmaschine Tests durch: Die einzelnen URLs erhalten dann immer wieder unterschiedliche Positionen in den Suchmaschinen, um die User Signals zu messen und zu vergleichen.

Ein konstantes Ranking ist dann schwer zu erreichen, weil Google immer mal wieder andere URLs oben in den Suchergebnissen anzeigt.

Das Problem lässt sich mittels des Canonical Tags beheben, wenn die Ursache im Duplicate Content liegt. Ranken URLs die eigentlich für andere Keywords gedacht waren, empfehlen wir dir, für diese URLs eine Onpage-Optimierung vorzunehmen.

So erkennt der Crawler dein Original

SEO Kompass Tipp Wenn du mehr über Keyword-Kannibalisierung wissen möchtest, dann empfehlen wir dir unseren Artikel “Was ist Keyword-Kannibalisierung und wie vermeide ich sie?” Hier erhältst du ausführliche Informationen, lernst Keyword-Kannibalisierung zu erkennen und zu beheben.

3. Google wählt die kanonische Version

Lieferst du der Suchmaschine nicht die gewünschten Informationen über deine Website, entscheidet sie oft selbst. Das kann auch bei doppelten Inhalten passieren.

Kann ein und derselbe Inhalt über mehrere URLs abgerufen werden und gibst du keinen (sinnvollen) Canonical Tag an, legt Google irgendwann selbst eine kCanonical URL fest.

Dennoch: Die Suchmaschine nimmt dir die Entscheidung ab, welcher Inhalt ab sofort rankt und auch häufiger gecrawlt wird, als sein “Zwilling”. Ist das nicht die Seite, die eigentlich ranken soll und auf Leads oder Conversions ausgelegt ist, verlierst du bares Geld.

John Mueller von Google erklärt im Google Webmasters Video, wie sich Google für eine Canonical URL entscheidet:

Wir haben für dich die wichtigsten Punkte aus dem Video zusammengefasst.

Google entscheidet sich für eine kanonische Seite, wenn:

  • sie einen Canonical Tag besitzt
  • 301-Weiterleitungen zu dieser Seite bestehen
  • sie eine gute interne Verlinkung aufweist
  • die URL in der Sitemap aufgeführt ist
  • es sich um eine Https-URL handelt
  • es eine sprechende URL ist

Wie setze ich den Canonical Tag richtig ein?

Der Canonical Tag kann auf zwei Arten eingefügt werden:

  1. Im head-Element des Quellcodes
  2. Im HTTP-Header des Dokuments

So sieht der Canonical Tag aus:

1. Canonical Tag im head-Element des HTML

Nehmen wir einmal eine Tracking-URL mit UTM-Parametern als Beispiel. Du hast einen tollen Blogbeitrag geschrieben, der folgende URL aufweist:

https://www.deinedomain.de/original-url/

Um den Erfolg deines Blogbeitrags auf Facebook zu tracken, stattest du die URL mit einem UTM-Parameter aus:

https://www.deinedomain.de/original-url/?utm_source=facebook&utm_medium=social&utm_content=tollerartikel&utm_campaign=SEOblog

Der Inhalt des Beitrags /original-url/ ist jetzt über zwei URLs abrufbar. Damit nicht die UTM-URL rankt, sollte ein Canonical Tag auf https://www.deinedomain.de/original-url/ gesetzt werden.

Die Canonical URL im head-Element des HMTL-Quellcodes:

<head>
<link rel=”canonical” href=”https://www.deinedomain.de/original-url”/>
.
.
.
</head>

Das geht entweder manuell, setzt dann aber Zugang zum Quellcode der Seite sowie HTML-Grundkenntnisse voraus. Gerade der Zugang zum Quellcode ist für viele Content-Produzenten und Content-Manager oft nicht gegeben.

Alternativ stehen für viele CMS Plugins zur Verfügung, die das Einfügen des Canonical Links deutlich vereinfachen. So kann die Canonical URL direkt im Backend in der Seite bzw im Beitrag hinterlegt werden. Das Plugin fügt die URL dann von selbst als Canonical Tag im Header ein.

Zu diesen Plugins zählen für WordPress beispielsweise das All in One SEO Pack oder Yoast SEO. Beide bringen zusätzlich zahlreiche weitere Features mit.

2. Canonical Tag im HTTP-Header

Wenn du keinen Quellcode zur Verfügung hast — wie es beispielsweise bei einem PDF-Dokument oder einer Druckversion der Fall wäre — gibt es auch kein-Bereich, in den du den Canonical Tag einfügen kannst. Kein Grund zur Sorge, denn in diesem Fall kannst du den Canonical Tag per htaccess im HTTP-Header unterbringen. Das kannst du auf zwei Arten umsetzen. So:

<files "white-paper.pdf">
Header add Link <"http://www.deindomain.de/downloads/white-paper.pdf>; rel=\"canonical\""
</files>

oder so:

<files "white-paper.pdf">
Header add Link <'http://www.deindomain.de/downloads/white-paper.pdf>; rel="canonical" '
</files>

Merke-IconAnders als im HTML dürfen Anführungszeichen in htaccess pro Code-Teil nur einmal verwendet werden. Das bedeutet: Im HTML kannst du <a href=“URL“; rel=“canonical“> verwenden, in htaccess nicht. Das kannst du umgehen, indem du im htaccess das zweite Paar Anführungszeichen mit sog. Maskierungszeichen (\) markierst (siehe Variante 1). Oder du ersetzt das erste paar Anführungszeichen durch Hochkommata (Variante 2).

Jede URL sollte eine Canonical URL haben

Zur Prävention solltest du jede URL mit einem Canonical Tag ausstatten. Handelt es sich nicht um eine Kopie, verlinkt man jede URL auf sich selbst. Dieses Vorgehen dient als Schutzmaßnahme vor Scrapern, die eine Website mit Crawlern kopieren und auf anderen Domains veröffentlichen. Das wäre nicht nur ein Plagiat, sondern natürlich auch externer Duplicate Content, der im schlimmsten Fall zu deinen Lasten ausgehen kann.

Durch den Canonical Tag wird dann jedoch das Original – nämlich dein Inhalt – als das Original angegeben. Das schiebt vielen Content-Dieben natürlich keinen Riegel vor, schließlich müssten sie einfach nur ihre URL als Canonical URL setzen. Aber wer einfach nur per Crawler Inhalte kopiert, kopiert auch deinen Canonical Tag mit und hat dadurch nichts gewonnen.

Darauf solltest du bei Canonical Tags achten

  • Canonical Tags sind für Seiten mit sehr ähnlichen bzw identischen Inhalten.Ein glücklicher Crawler mit einem Herzchen auf dem Rücken
  • Der Canonical Tag muss im head-Element des Quellcodes oder im HTTP-Header untergebracht werden
  • Es kann immer nur ein Canonical Tag pro URL vergeben werden
  • Die Canonical URL muss zu 100% der “Original”-URL entsprechen
  • Die Canonical URL muss erreichbar sein. In anderen Worten: Deine “Original” URL muss wirklich existieren und darf keinen 404-Statuscode aufweisen.
  • Bei kanonischen Links sollte kein “noindex”, “disallow” oder “nofollow” verwendet werden. Gerade bei robots.txt Directives gelangt der Crawler gar nicht erst auf die Seite und kann demnach auch den Canonical Tag nicht auslesen und befolgen.
  • Oft sind mobile Versionen einer URL unter einer anderen URL erreichbar – z. B. m.deinedomain.de. Auch hier sollte per Canonical URL auf die Desktop-Version gezeigt werden.
  • Zwar ist es möglich, sowohl relative als auch absolute Pfade im Canonical Link anzugeben, aber es wird ausdrücklich empfohlen, nur absolute Pfade zu verwenden.
  • Paginierte Seiten sollten keine Canonical URL erhalten, denn sie sind ja in der Regel nicht identisch. Hier ist der Einsatz von rel=“next“ und rel=“previous“ sinnvoll.
  • Statte jede URL mit einem Canonical Tag aus. Ist sie keine Kopie, zeigt er auf sich selbst.

Dein Canonical Tag Cheat Sheet

Es lässt sich nicht immer vermeiden, dass ein und derselbe Inhalt über mehrere URLs abrufbar ist. Nutze dann den Canonical Tag, um deine präferierte URL als das Original auszuzeichnen.

Achte dabei aber auf jeden Fall auf eine korrekte Anwendung des Canonical Tags, damit er auch richtig funktionieren kann. Als Gedankenstütze hilft dir natürlich unser Cheat Sheet, das du dir auch ganz einfach herunterladen kannst.

Alles, worauf du beim Cannonical Tag in der Praxis achten musst

Cheat Sheet Downloaden