Découverte des secrets du géant de la recherche : Les méthodes de classement de Google révélées

Rate this post

Lors de son procès antitrust, Google a dû divulguer des documents internes mettant en lumière le processus de classement des résultats de recherche. Ces documents offrent un aperçu précieux sur les critères et les processus qui influencent la visibilité des pages web dans ses résultats.

Note : Certains de ces documents datent de plusieurs années, il est donc important de prendre ces informations avec précaution, car elles ont pu évoluer depuis.

Les 3 piliers du classement selon Google

Selon une diapositive nommée « The 3 pillars of ranking », Google met l’accent sur 3 éléments :

  • Contenu : ce que le document dit de lui-même ;
  • Ancre : ce que le web dit du document ;
  • Interactions : ce que les utilisateurs disent du document.

Les interactions incluent notamment les clics, l’attention portée à un résultat, les clics sur un carrousel, le survol de la souris, le défilement et la saisie d’une nouvelle requête.

Classements : Un aperçu de 2016

Un autre document révélé est une présentation préparée par Eric Lehman en 2016 concernant les classements. Lehman affirme entre autres que Google prétend comprendre les documents, mais que ce n’est pas vrai : « Notre capacité à comprendre directement les documents est minimale. Si un document suscite une réaction positive, nous pensons qu’il est bon. »

Il est évident que l’importance des interactions des utilisateurs pour classer les résultats a toujours été importante, mais il ne fait aucun doute que la compréhension du contenu par Google s’est considérablement améliorée depuis 2016.

Les 18 aspects de la qualité de recherche

Dans une présentation datant de novembre 2018, Google aborde 18 aspects de la qualité de recherche :

  • Pertinence
  • Qualité de la page
  • Popularité
  • Fraîcheur
  • Localisation
  • Langue
  • Personnalisation
  • Écosystème web
  • Compatibilité mobile
  • Spam
  • Autorité
  • Confidentialité
  • Etc.

Google is magic : Comment fonctionne la recherche Google ?

Retour en 2017 avec la présentation « Google is magic » qui contient plusieurs diapositives intéressantes. Notamment celle-ci, qui explique comment la recherche Google ne fonctionne pas et celle-là, qui décrit comment elle fonctionne :

« Search is a bit like a potluck where each person brings a dish to share. Similarly, search relies on a huge body of knowledge. On the contrary, everyone who comes to perform a search brings some knowledge to the system that everyone can benefit from. »

D’autre part, les journaux de recherche sont essentiels pour classer les résultats :

« As I mentioned earlier, not just one system but many rankings are built on logs. It’s not just traditional systems like I showed you earlier but also more advanced machine learning systems many of which have been announced externally : RankBrain RankEmbed and DeepRank In general I think an enormous part of Google’s activity relates to using logs in ranking. »

Le classement mobile/desktop

Un e-mail concernant les différences entre les classements de recherche sur ordinateur et sur mobile a également été rendu public, mais il date de 2014.

Premières expériences avec BERT

Enfin, un très petit document contenant des points clés pour une présentation à Sundar Pichai datée de septembre 2019 révèle deux points intéressants concernant BERT :

« The first generation [de BERT] improves results for every language tested (although it only went wide for English)
Next-gen algorithm improvements underway with focus on further improving non-english languages »

En conclusion, ces documents internes apportent un éclairage précieux sur les méthodes et critères utilisés par Google pour classer les pages web dans ses résultats de recherche. Toutefois, il est important de garder à l’esprit que certaines informations peuvent avoir évolué depuis la publication de ces documents. L’optimisation continue du moteur de recherche et les avancées technologiques permettront sans aucun doute à Google de mieux comprendre et classer les pages web dans le futur.

 

Sources