Skip to main content
SEO

Comment fonctionne Google ?

Par 18 décembre 2019janvier 4th, 20232 Commentaires

Comment fonctionne Google ? En tant que consultant SEO à Nice, c’est une des premières choses que j’explique à mes clients. Si l’on veut travailler le référencement de son site web, acquérir plus de visibilité et de trafic, il existe des tas de techniques SEO et critères à prendre en compte. Le truc, c’est que si vous ne savez pas comment fonctionne Google, tous ça ne vous servira à rien. Pour moi, c’est donc la première question à se poser avant de travailler son référencement.

Allons droit au but, pour le référencement naturel, Google fonctionne en 3 étapes :

1. Le Crawl

2.L’indexation

3.Le classement

Les 3 étapes du fonctionnement de Google

Etape 1 : le crawl

Ce petit nom barbare se traduit simplement par « visite » ou « analyse ». La première étape, c’est donc une analyse du site web. Quand un site internet est mis en ligne, Google va envoyer des « robots » ou « spider » pour visiter le site web. Ces robots vont partir de la page d’accueil (pas toujours mais c’est souvent le cas) et vont suivre les liens qui s’y trouvent afin de naviguer sur 100% des pages du site. C’est le crawl.

Etape 2 : l’indexation

Deuxième étape, les robots vont vérifier que chaque page, une à une, respectes bien les règles du géant Google. Dans la plupart des cas, toutes les pages sont bien indexées. Google va alors copier le contenu de chaque page web et le stocker dans ses serveurs. Chaque pages indexées est alors accessible dans le moteur de recherche.

Etape 3 : le classement

Le classement et l’indexation sont des phases très proches puisque Google classe automatiquement un site web après son indexation. Je divise souvent les deux pour expliquer à mes clients l’importance des mots-clefs utilisés sur leur site web. En effet, Google classe les sites web suivant les requêtes des internautes + le niveau de référencement du site + la concurrence.

Pour résumer comment fonctionne Google, il analyse l’ensemble des pages web d’un site via ses robots. Il vérifie que les pages sont bien adaptées pour le web et qu’elle respecte tout un tas de critère puis il fini par classer chaque pages par pertinence.

Vous savez maintenant comment fonctionne Google, vous voyez, ce n’est pas bien compliqué. Voyons maintenant ce qu’il faut en retenir.

Comment contrôler et optimiser les 3 étapes de Google ?

Contrôler et optimiser le crawl

Nous avons dit que les robots de Google partaient toujours d’une page web pour analyser tout le site. En général, il part de la page la plus ancienne, celle qu’il aura découvert en premier. Ce n’est pas toujours la page d’accueil mais c’est souvent le cas. En partant de cette page et pour trouver les autres, les robots vont suivre les liens présents sur les pages. D’où l’importance que chaque page d’un site reçoivent au moins 1 lien d’une autre page (je préconise toujours 3 liens entrants au minimum), sinon comment Google pourrait la trouver ? (il le peut mais pas toujours).

Le crawl de Google se contrôle via le fichier robots.txt. Il s’agit d’un simple fichier texte (bloc note) présent dans les dossiers d’un site web (à la racine). Ce fichier permet d’indiquer à Google les pages que l’on ne souhaites pas voir analyser (et donc indexées). Pour cela il faut utiliser la commande « disallow: « . Par exemple, si je veux empêcher Google d’analyser ma page de demande de devis : https://redback-optimisation.fr/demander-un-devis/ je vais ajouter dans le fichier robots.txt le texte suivant : Disallow: /demander-un-devis

Contrôler le crawl est une technique surtout utiliser sur les gros sites web qui souhaites économiser du budget crawl. J’en reparle dans l’article suivant.

architecture site web min

Afin d’optimiser le crawl, il faut faciliter la tache à Google. Voici quelques critères techniques pour gagner du temps :

  • Le maillage interne : nous l’avons vu, Google utilise les liens pour passer de page en page. Il faut donc ajouter des liens pertinents dans les pages. Il faut surtout que ces liens ne soient pas en erreurs.
  • La profondeur : s’il faut trop de clique pour atteindre une page, les robots risquent de ne pas y arriver (les internautes non plus d’ailleurs). Chaque page doit être accessible en moins de 3 cliques.
  • Le temps de téléchargement : les robots n’ont qu’un temps limité à chaque passage pour visiter un site. Si une page est trop lourde, les robots vont mettre longtemps à l’analyser et auront moins de temps pour les autres. Ils peuvent donc louper des pages qui ne seront donc jamais indexées.
  • La directive « no-follow » : vous pouvez indiquer aux robots de ne pas cliquer sur un lien via un simple code HTML. Si Google ne visite pas la page, elle ne sera pas indexée. C’est encore une technique (discutable) pour économiser du budget crawl.

Contrôler et optimiser l’indexation

Dans la plupart des cas, une page crawlée est bien indexée. A ce niveau, il faut surtout se demander quelles pages vous souhaitez garder et quelles pages vous ne souhaitez pas indexer. Vous allez me poser la question : « pourquoi des pages ne devraient pas être indexées ? »

Je dirais : « voilà comment fonctionne Google : dans la phase « classement », Google va donner une note globale à votre site web. Il s’agit d’une note moyenne de qualité basée sur la qualité de chaque page indexées. C’est exactement comme à l’école : la moyenne générale est le résultat des moyennes de chaque matière. Pour le SEO, chaque page de mauvaises qualités va faire baisser la note globale (C’est l’algorithme Panda de Google). Ces pages de faibles qualités doivent alors être supprimées pour ne garder que les meilleurs (voir la technique). C’est le cas par exemple des pages « mentions légales » ou « CGV » qui ne sont pas pertinentes par rapport au site. De plus, personne ne vas taper « mentions légales + votre entreprise » dans Google. Ces pages n’ont aucun intérêt pour le trafic organique. Dans mes audits SEO, je vais beaucoup plus loin en analysant chaque critères de qualité de Google, cela me permet de calculer la note moyenne SEO de chaque page et de, soit supprimer ces pages de l’index, soit les améliorer.

À ne pas rater !
Audit SEO Offert

Je fais un premier état des lieux de votre site web manuellement. Testez votre site web !

Adresse e-mail non valide

Une fois la page indéxée, elle est visible sur Google

Pour contrôler l’indexation, il y a aussi plusieurs techniques :

  • La balise No-index : c’est la méthode la plus simple. Vous pouvez l’ajouter sur une page en 30 secondes via Yoast SEO si vous utilisez WordPress. Cette balise indique à Google de ne pas indexer une page.
  • La balise canonical : sur un ensemble de pages, cette balise permet d’indiquer à Google qu’une page est l’originale. Cela permet d’éviter le contenu dupliqué en n’indexant pas les pages en doublons ou trop similaires. On retrouve surtout cette technique sur les sites e-commerces.

Découvrez mon guide pour optimiser l’indexation de vos pages.

Contrôler et optimiser le classement

C’est à ce niveau que le travaille d’un consultant SEO prend tous son sens. C’est LA où je passe le plus de temps. Pour obtenir le meilleur classement, il faut prendre en compte des centaines de critères SEO réparti en 4 grands piliers SEO :

Je reviens sur ces piliers et l’optimisation dans divers articles sur mon blog.

Foire Aux Questions

Comment indexer rapidemment une page web ?

Votre site vient d’être mis en ligne ou vous souhaitez indexer vos articles dès leur mise en ligne ? Comment ça marche Google ? Deux solutions s’offrent à vous :

  • Le backlink : si vous arrivez à placer un lien « Do Follow » sur un site populaire déjà indexé. Google va le suivre assez rapidemment est indexer votre page web. Découvrez en plus sur les backlinks. C’est la technique la plus compliqué et la plus couteuse.
  • L’envoi de votre page à Google : vous passez simplement par Google Search Console – Inspection d’URL. Vous allez soumettre à Google votre page qui viendra la crawler et l’indexer généralement dans les 3 minutes suivantes.

Pensez que Google peut mettre jusqu’à 1 mois pour indexer une page web si les 3 étapes du fonctionnement de Google ne sont pas bien optimisées.

Comment supprimer une page de l'index de Google ?

Comme nous l’avons vu. Il est nécessaire de ne pas indexer certaines pages, celles de faibles qualités. Si vos pages sont déjà indexées, vous pouvez passer par Google Search Console – Index  – Suppressions.

Ensuite, vous devez vous rendre en FTP sur votre fichier « robots.txt » afin d’ajouter cette URL pour indiquer aux robots de Google de ne pas revenir crawler cette page.

Attention, sans l’étape 2, il ne sert à rien de supprimer la page de l’index car Google la re-indexera.

La deuxième partie est un peu technique, n’hésitez pas à me contacter pour que nous en discutions.

Comment savoir le nombre de page indexées de mon site ?

Simplement via la recherche Google : site:nomdedomaine

100% des pages que vous avaient souhaité indexer doivent l’être, sinon faites un audit SEO.

Comment savoir si mon site est bien optimisé techniquement ?

Savoir si votre site web est bien optimisé techniquement n’est pas chose évidentes si on ne s’y connait pas en référencement naturel. Pour vous aiguillez, j’ai rédigé un article sur le sujet —> Le référencement interne du site web.

Comment fonctionne Google ? Conclusion

Vous l’aurez donc compris, on peut contrôler les 3 étapes du fonctionnement de Google :

  • Le crawl ou l’analyse de Google
  • L’indexation des pages
  • Le classement des pages

On peut donc tout à fait laisser une page être analysée mais non indexée. Globalement, si vous avez un petit site web, vous n’avez pas besoin de bloquer l’analyse de certaines pages. En revanche, il est bon de jouer sur l’indexation des pages pour ne garder indexée que les pages dédiées au référencement.

Egalement, vous devez savoir que Google peut mettre jusqu’à 1 mois pour indexer une page. Il est donc crucial de bien contrôler et optimiser les 3 étapes du fonctionnement du moteur de recherche pour que 100% de vos pages importantes soit bien analysées, indexées et classées rapidemment. 

Pour vérifier la bonne indexation d’une page, vous pouvez jeter un œil à mon article sur la Google Search Console.

Florian Zorgnotti

Consultant SEO WordPress à Nice, j'accompagne les info-preneurs, TPE et PME dans leur stratégie webmarketing et leur recherche de visibilité sur le web. Spécialisé en référencement WordPress, je propose aussi du coaching et des formations en ligne.

2 Commentaires

Laisser une Réponse

treize + 16 =