Rankbrain est le nouvel outil mis en place par le moteur de recherche Google pour améliorer la pertinence de ses résultats. Ce système, qui se base sur l’intelligence artificielle, est destiné à améliorer la compréhension de l’intention des requêtes faites par les internautes afin de proposer les résultats les plus appropriés.
Rankbrain et la compréhension de l’intention :
Bien que ses applications potentielles soient plus larges, l’objectif de Rankbrain (ou Rank Brain) semble être d’améliorer la pertinence des résultats de recherches pour lesquels un procédé d’analyse algorithmique “classique” n’est pas adapté.
Par exemple, sur une requête telle que “Quel est le nom du maillon le plus haut dans la chaîne alimentaire ?”, l’algorithme de Google (Hummingbird) aura tendance à proposer des résultats basés sur les mots clés et renverra vers des pages traitant de la chaîne alimentaire et de ses maillons. La réponse à la question posée sera trouvable dans les résultats mais l’analyse sémantique de l’algorithme Hummingbird reste perfectible, surtout face à des requêtes inédites.
Sur ce type de requête complexe Rankbrain proposerait de renvoyer les résultats de la requête “Superprédateur” qui, bien que ne comportant pas les mots clés demandés par l’internaute, répondra plus précisément à l’intention de sa recherche.
Intelligence artificielle et apprentissage automatique : comment fonctionne Rankbrain ?
Cet outil, qui s’inscrit dans la logique du Knowledge Graph de Google (énorme base de données comportant des entités comme des sujets, des personnes, des événements et les relations entre elles) fonctionne par apprentissage automatique. Pour mener cet apprentissage, Google identifie les informations présentes dans les pages web sous forme de vecteurs mathématiques (adaptés à un calcul par une machine) et cherche à les comparer entre eux. Ainsi, face à un vecteur inconnu, (telle qu’une requête inédite), Rankbrain recherche quels sont les vecteurs les plus proches afin de recouper les informations et de “deviner” l’intention de la requête. On parle alors de machine learning.
Rankbrain ne semble pas (encore?) fonctionner en live. Il n’est pas intégré à l’algorithme de traitement en temps réel et son apprentissage se fait donc hors ligne : des historiques de recherches lui sont transmises ponctuellement par les ingénieurs et les résultats des calculs sont ensuite intégrés dans l’algorithme.
Quels sont les résultats impactés par Rankbrain ?
Théoriquement, tous les résultats peuvent être impactés, toutefois Google a indiqué que cet outil était principalement efficace sur les requêtes inédites et non concurrentielles. Chaque jour, 15% des requêtes soumises à Google sont inédites et Rankbrain peut permettre à Google de ne pas seulement afficher une liste de résultats mais de répondre le mieux possible à une requête faite en langage naturel. Avec le développement des recherches vocales, on comprend bien l’importance pour le moteur de recherche de développer ses capacités de traitement automatique du langage naturel (TALN).
Rankbrain est-il un algorithme, un critère de classement, un filtre ?
Il semble que ce ne soit ni un algorithme de classement, ni un filtre de qualité (comme Panda ou Pingouin) mais plutôt un outil sémantique complémentaire. Il n’a pas (encore ?) d’impact direct sur le classement des résultats et il se rapproche plutôt d’un outil permettant de qualifier le plus précisément possible une requête inédite. Il n’a pas été annoncé que ce système pourrait nuire au classement d’un site, ce qui le différencie des filtres Panda et Pingouin.
Quel impact pour le SEO ?
Difficile de se prononcer avec certitude, mais les efforts constants de Google en matière de traitement automatique du langage naturel montrent l’importance d’une bonne gestion du contenu de son site web. Ce n’est évidemment pas la fin de l’optimisation des requêtes basées sur des mots clés mais on constate que Google arrive de mieux en mieux à aller au-delà des mots clés pour trouver un sens à une requête. La cohérence sémantique prend de plus en plus d’importance et les architectures de site web en silo ou en cocon (qui organisent l’information par thématiques) semblent promises à un bel avenir.
Pas de pitié pour les contenus inutiles! Il convient plus que jamais d’écrire des contenus précis et complets sur un sujet, puis de les ranger au bon endroit sur son site.