Comment fonctionne un moteur de recherche sur Internet ?

Les moteurs de recherches facilitent notre vie au quotidien : besoin d’informations sur un produit, les derniers films au cinéma, dernier résultat de votre équipe de foot préférée, météo du jour …

Comment fonctionne un moteur de recherche sur Internet ?

Les moteurs de recherches les plus connus dans le monde ont pour nom Google, Yahoo, Bing, Yandex, Baidu … En France, c’est Google qui domine avec près de 90 % de parts de marché. Si nous connaissons tous le service qu’apporte les moteurs de recherche, cette simple requête tapée qui génère des milliers, des millions de résultats mais nous sommes moins nombreux à savoir ce qu’est un moteur de recherche. Les questions sont nombreuses sur un outil, le moteur de recherche qui fait partie intégrante de notre quotidien mais que nous connaissons bien mal.

  • Comment fonctionne-t-il ?
  • Comment fait-il le tri parmi ces milliers de pages web, de sites qui composent le web ?
  • Comment repère-t-il les nouveaux sites web qui viennent de se créer ?
  • Comment un moteur de recherche effectue son classement des résultats ?
  • Que prend-il en compte ?

Qu’est-ce qu’un moteur de recherche ?

Il est bon de préciser que l’ensemble des moteurs de recherches, Google, Yahoo, Bing vont fonctionner de la même manière. Un moteur de recherche est un ensemble de logiciels qui va parcourir le web, puis il va indexer automatiquement les pages visitées. Les moteurs de recherches vont tâcher de d’avoir en local, dans un énorme data-center, une copie locale du web qui soit la plus précise possible et à la mise à jour la plus récente. C’est ce qui va différencier les moteurs de recherche, la qualité de l’index et de l’algorithme.

Comment un moteur de recherche va crawler le web ?

Pour alimenter son index, sa copie locale du web, un moteur de recherche s’appuie sur des robots, des bots, nous parlons de Googlebot dans le cas de Google. Le parcours de Googlebot va partir d’un lien vers votre page d’accueil, il va récupérer le code HTML de votre site pour l’indexer, Googlebot va capturer tout le contenu, les images, le texte avant dans un second temps de suivre l’ensemble des liens de la page pour aller vers les pages correspondantes tant en interne qu’en externe, c’est-à-dire en dehors de votre site. C’est de cette manière, que Google va crawler le web !

Olivier Andrieu, l’un des plus connus des experts SEO français parle au sujet de Googlebot, « d’internaute fou » qui clique sur tous les liens. Googlebot va repérer si la page a été mise à jour récemment. En présence d’un nouveau contenu, alors aussitôt Googlebot va mettre à jour le site dans son index. Les créateurs de site web s’interrogent souvent pour savoir quand est-ce que les bots des moteurs de recherches sont venus sur leurs sites, sachez que les bots à commencer par Google Bot s’adaptent à la fréquence de mise à jour de vos contenus.

Google pour procéder dans un second temps au classement des nombreux résultats utilise un algorithme de pertinence qui se compose de 200 critères. Google va alors chercher parmi les milliers, les milliards de pages web à identifier les pages qui vont répondre au mieux, de la manière la plus pertinente aux requêtes tapées par les internautes. Google parcourt, « crawle » 20 milliards de sites par jour. Les référenceurs SEO le disent, Google est une machine à crawler !

L’algorithme de pertinence de Google est devenu très complexe, Google effectue en moyenne 1 600 modifications par an dans son algorithme et même plus de 3 200 modifications ont été réalisées en 2018.
Une complexité de l’algorithme qui s’explique aussi par les technologies employées pour l’améliorer en continue. Google s’appuie sur des concepts d’intelligence artificielle comme le machine learning et les réseaux de neurones pour continuer à proposer des résultats naturels toujours plus pertinents pour l’internaute. Des technologies complexes, des critères de pertinence toujours plus précis, nous sommes très loin du critère quasi unique du « nombre d’occurrence du mot clé dans la page » des Lycos et autres webcrawler en 1994 ou de l’utilisation de la balise meta « keywords » d’AltaVista en 1996.

Le SEO (Search Engine Optimization) ou référencement naturel qui est l’art d’optimiser une page pour les moteurs de recherches consistait à cette époque à répéter le plus possible un mot clé dans une page pour que celle-ci se positionne par la suite sur la requête. Une tendance au bourrage de mots clés sur la page qui est révolue.

Quelles sont les étapes indispensables au fonctionnement d’un moteur de recherche ?

Quatre étapes sont indispensables à son fonctionnement :

  • La collecte d’informations (crawl) grâce à des robots
  • L’indexation des données collectées et la constitution de l’index
  • Le traitement des requêtes, avec interrogation de l’index suite à la saisie de mots clés par l’utilisateur et classement des résultats en fonction de critères de pertinence
  • La restitution des résultats dans des pages de résultats organiques qui prennent la forme d’une liste de dix liens affichés les uns en dessous des autres.

Quel est le rôle exact d’un moteur de recherche ?

Un moteur de recherche se doit de présenter à l’internaute un ensemble de résultats qui doivent être les plus pertinents possibles pour répondre à la question de l’internaute.

Le critère principal pris en compte par l’algorithme de Google a été pendant très longtemps celui de la popularité du site web pour classer les pages et les sites web. Celle-ci s’obtient pour un site web par le le nombre de liens entrants qui pointent vers votre site web. C’est ce qu’on appelle le Pagerank du nom d’un des fondateurs de Google, Larry Page.

En 2020, d’autres critères sont pris en compte comme la structuration et la hiérarchisation des contenus (balisages Hn, maillage interne), le temps de chargement des pages et le responsive design, le fait que votre site soit adapté à chaque support (desktop, mobile et tablette). Depuis 2018, Google est en mode « index mobile first », il regarde votre site web sur mobile avant de le regarder sur les autres supports.

Votre site web se voit accorder notamment par Google un temps limité de crawl, vous devez donc tout faire pour faciliter la circulation des bots sur votre site web. Celui-ci doit être ce qu’on appelle « Google friendly ».

Les pages de votre site web doivent être composées également de contenus à la quantité suffisante.

Celui-ci est de plus en plus exigeant, un site web doit clairement aujourd’hui démontrer aux yeux de l’algorithme toute son expertise, son autorité et la confiance grâce notamment à des liens entrants de qualité et à du contenu très qualitatif tant par son degré de maîtrise de la sémantique que de la taille des contenus.

Google entend devenir un moteur de réponses, son objectif répondre de manière la plus pertinente à toutes vos questions. C’est pourquoi les pages de résultats de Google, les SERP sont devenus de plus en plus complètes.

Mettons de côté, le référencement payant, les liens sponsorisés ou SEA, vous pourrez retrouver dans les pages de résultats naturels de Google :

  • le knowledge graph (informations encyclopédiques)
  • la recherche universelle (actualités, images, vidéos) (lien vers la page fille « recherche universelle
  • l’answer box (la réponse à votre question)
  • le featured snippet,
  • la maps avec une liste d’adresses locales

L’avenir du fonctionnement des moteurs de recherche est aujourd’hui impacté par le développement de la recherche vocale. Certains des plus grands référenceurs français parlent d’un nouveau paradigme ! Avec la recherche vocale, le terminal qui représente les résultats d’une requête est tout autre, terminé la SERP comme on l’a connaît ! La recherche vocale repose sur une enceinte connectée qui reconnaît le langage parlé, la vocalisation en guise de réponse à la question de l’internaute va reprendre le plus souvent le contenu du featured snippet, « la position zéro ». Cela va impacter notamment l’art d’optimiser les pages web, le SEO !

Les entreprises doivent désormais penser ou repenser leurs pages web pour tenter de s’afficher en position zéro. Nous passons donc d’une logique de mots clés à une logique de questions/réponses. Les moteurs de recherches et notamment Google deviennent plus que jamais des moteurs de réponses.

Un projet ? Un besoin ? Notre équipe vous accompagne

Les stratégies de marketing digital peuvent permettre à chaque entreprise d’obtenir des résultats rapides et quantifiables, à condition d’adapter les objectifs et les leviers à chaque profil d’entreprise. Les équipes conseil Yumens sont à votre disposition pour concevoir avec vous une stratégie webmarketing adaptée à vos objectifs et ambitions.

Décoration dots

Vous souhaitez échanger sur votre projet ?

  • Proximité
  • Expertise
  • Pédagogie
  • Innovation
Haut de page