Passer au contenu principal

Budget d'exploration

le Budget d'exploration o Le budget d'exploration est défini comme le nombre maximal de pages explorées par Google dans un portail Web.

Définition

Google détermine lui-même le nombre de sous-pages qu'il explore par URL. Ce n'est pas la même chose pour tous les sites Web, mais selon Matt Cutts, il est principalement déterminé en fonction du PageRank d'une page. Plus le PageRank est élevé, plus le budget d'exploration est élevé. Le budget d'exploration détermine également la fréquence à laquelle les pages les plus importantes d'un site Web sont explorées et la fréquence à laquelle une analyse approfondie est exécutée.

Différenciation du budget d'index

Le terme budget d'index est différent d'un budget d'exploration. Déterminez le nombre d'URL pouvant être indexées. La différence devient évidente lorsqu'un site Web contient plusieurs pages renvoyant un code d'erreur 404. Chaque page demandée a le budget d'exploration, mais si elle ne peut pas être indexée en raison d'un message d'erreur, le budget d'index n'est pas entièrement utilisé.

Problème

Le budget d'exploration ou le budget d'exploration constitue un obstacle pour les sites Web plus volumineux comportant de nombreuses sous-pages. Plus précisément, toutes les sous-pages ne seront pas explorées, mais seulement une partie d'entre elles. Par conséquent, toutes les sous-pages ne peuvent pas être indexées. Cela signifie à son tour que les opérateurs de site peuvent perdre du trafic car les pages concernées n'ont pas été indexées.

Importance pour le référencement

Il existe toute une section d'optimisation des moteurs de recherche dédiée spécifiquement à cette situation, dans le but de diriger le Googlebot, afin que les budgets de crawl existants soient utilisés très judicieusement et les pages de haute qualité qui revêtent une importance particulière pour l'opérateur de la recherche. moteur. portail web sont indexés. Les pages moins importantes doivent être identifiées en premier. En particulier, cela inclut les pages avec un contenu médiocre ou peu d'informations, ainsi que les pages incorrectes qui renvoient un code d'erreur 404. Ces pages doit être exclu de l'exploration afin que le budget d'exploration reste disponible pour les pages de meilleure qualité. Ensuite, les sous-pages importantes doivent être conçues de manière à être explorées par les araignées en priorité. Les actions possibles dans le cadre de l'optimisation de l'exploration comprennent:

  • Implémentation d'une architecture de page plate où les chemins de sous-pages sont aussi courts que possible et ne nécessitent que quelques clics.
  • Liens internes de pages avec beaucoup de backlinks vers des pages censées être explorées plus souvent.
  • Très bons liens internes à partir des pages les plus importantes.
  • Exclusion des pages sans importance pour l'exploration à l'aide du fichier robots.txt (telles que les pages de connexion, les formulaires de contact, les images).
  • Exclure la traçabilité ou l'exploration via l'utilisation de métadonnées (noindex, nofollow).
  • Fournissez un plan de site XML avec une liste d'URL pour les sous-pages les plus importantes.

Si le portefeuille de pages explorées et indexées est amélioré grâce à l'optimisation de l'exploration, le positionnement peut également être amélioré. Les pages bien classées sont explorées plus souvent, ce qui à son tour est payant.

Une conférence informative sur les «Meilleures pratiques de budget d'exploration» par Jan Hendrik Jacob Merlin à SEOkomm 2015 peut être trouvée ici.

Liens web