Im Allgemeinen ist die Indizierung' bezieht sich auf eine Methode zur Informationserfassung (Informationsentwicklung), mit der Dokumente anhand von Schlüsselwörtern gesammelt und klassifiziert werden. Dann wird ein Index gebildet, der einer Bibliothek ähnlich ist. Indizierte Dokumente, hauptsächlich Textinhalte, werden für eine bestimmte Dokument- oder Schlüsselwortsuche vorbereitet und mit Deskriptoren versehen.
Wenn Sie ein Schlüsselwort und verwandte Dokumente wünschen, sollte im Idealfall der relevanteste Inhalt angezeigt werden. In einer Bibliothek können Deskriptoren Daten wie Autor, Titel oder ISBN-Nummern sein. Im Prinzip passiert das auch bei einer Abfrage im Internet. Mit anderen Worten bezeichnet der Begriff Indizierung das Training eines Index, in dem Webdokumente unter Verwendung verschiedener Deskriptoren (wie Schlüsselwörter) gesammelt und klassifiziert und für nachfolgende Suchen (Informationsabruf) verfügbar gemacht werden.
Allgemeine Information
Die Indizierung von Webdokumenten ist ein umfangreiches und komplexes Verfahren, bei dem verschiedene Methoden aus den Bereichen Informationswissenschaft, Informatik und Computerlinguistik verwendet werden. Ein weiterer wichtiger Begriff ist neben der Informationsentwicklung (siehe oben) und dem Abrufen von Informationen das Data Mining, bei dem wertvolle Inhalte aus einer großen Datenmenge klassifiziert werden.
Vor der Eingabe einer Suchdefinition werden mehrere mit der Indizierung verbundene Prozesse ausgeführt. Webdokumente müssen durchsucht und analysiert werden (siehe Crawler, Spinnen, Bots). Diese werden gesammelt, sortiert und indiziert, bevor sie in Suchmaschinen-SERPs in einer bestimmten Reihenfolge angezeigt werden können. Suchmaschinenanbieter wie Google, Yahoo oder Bing arbeiten ständig daran, die Website-Indizierung zu verbessern, um die relevantesten Inhalt.
Google hat kürzlich seinen Index geändert und in den Koffeinindex eingetragen. Sie sollen Webinhalte durch ständige und synchrone Suche in bestimmten Teilen des globalen Internets schneller indizieren. Gleichzeitig sollen Webinhalte wie Videos oder Podcasts leichter zu finden sein.[1].
Praktische Relevanz
Für Site-Betreiber und Webmaster ergeben sich unterschiedliche Konsequenzen und Möglichkeiten hinsichtlich der Indizierung. Wenn eine Webseite indiziert und im Index gefunden werden soll, muss sie zuerst dem Crawler oder der Spider zur Verfügung stehen. Wenn es aus einer neuen Website besteht, kann es an die Suchmaschine gesendet werden, um durch Registrierung in den Index aufgenommen zu werden. Das Web muss für den Crawler lokalisierbar und bis zu einem gewissen Grad lesbar sein.
Meta-Tags, die im Header-Bereich einer Webseite aufgeführt werden können, sind eine Möglichkeit, dies sicherzustellen. Sie können auch verwendet werden, um den Zugriff von Crawlern zu unterdrücken, um eine bestimmte Seite aus dem Index auszuschließen. Zu diesem Zweck können auch kanonische Tags und andere Tags aus der robots.txt-Datei verwendet werden. Der Indizierungsstatus kann in der Google Search Console abgerufen werden. Bereits im Index enthaltene URLs werden auf den Registerkarten Google-Index und Indexstatus angezeigt. Dies schließt diejenigen ein, die vom Site-Betreiber blockiert wurden.
Indizierung und SEO
Die Indizierung ist für SEO sehr wichtig. Webmaster und Weboperatoren können diesen Vorgang von Anfang an steuern und sicherstellen, dass Webseiten gecrawlt, indiziert und anschließend in den SERPs angezeigt werden. Unabhängig davon kann Ihre Position in den SERPs nur durch verschiedene OnPage- und OffPage-Maßnahmen und die Bereitstellung hochwertiger Inhalte beeinflusst werden.
Sie sollten sich auch auf dem Laufenden halten, da Google seine Algorithmen regelmäßig ändert, um Spam-Websites oder Link-Netzwerke aus dem Index auszuschließen.
Web-Links