Par Philippe LAINE , consultant SEO Darwin agency.
Si, comme nous, vous avez souvent le nez dans vos stats Google Analytics, vous n’aurez pas manqué de remarquer des sites franchement louches parmi les sites référents.
Vous pouvez les ignorer, mais sachez qu’ils peuvent désormais représenter 50% du trafic référent d’un site. Ils faussent complètement des données importantes comme le taux de rebond ou le nombre de pages vues par visiteurs.
Comment les identifier, comment s’en débarrasser?…
Jusqu’à 50% de faux trafic référent
Regardez votre trafic référent dans Google Analytics: Acquisition > Tout le trafic > Sites référents. Ce sera plus parlant sur une période de 3 mois.
Dans cet exemple, trié par nombre de sessions, il y a quelques vrais sites référents, dont Google.fr (qui est en fait Google images), mais les 6 autres sont de faux référents.
C’est à dire que ce ne sont pas réellement des sites qui ont amené du trafic vers votre site via un lien.
Il y a deux catégories de faux sites référents :
– les crawlers, comme Semalt.
Ce sont des robots qui explorent les pages de votre site de façon automatisée, afin d’en extraire des données. Google, Bing ou Yahoo font de même, mais Google Analytics le sait et les exclut automatiquement. Ce n’est pas le cas de Semalt, qui du coup est vu comme n’importe quel visiteur.
– les spammeurs sont des sites qui cherchent à attirer l’attention des webmasters en apparaissant dans leur console Analytics, pour ensuite essayer de leur vendre un produit.
Il y en a d’ailleurs de plus en plus.
Des statistiques faussées qui pourraient impacter vos positions dans Google :
Que ces faux sites référents soient des crawlers ou des spammeurs, ils nous posent problème.
En effet, si vous comparez votre trafic global, et à fortiori votre trafic référent, avec celui de l’année précédente, vous pourriez constater une croissance qui sera en réalité en grande partie artificielle.
Plus grave, ces faux visiteurs présentent généralement un taux de rebond de 100%. A force, cela plombe vos stats générales. Et même vis à vis de Google, cela peut finir par poser un problème pour votre ranking.
Pour certains de nos clients avec un faible trafic, ces faux sites référents représentent de 5 à 50% du trafic référent.
Comment se débarrasser de ces faux sites référents ?
Il existe deux solutions, qu’il peut-être intéressant d’utiliser de concert : ajouter un filtre dans Google Analytics et bloquer les spammeurs à la source.
En préambule, dans Google Analytics, commencez par aller dans Admin > Paramètres de la vue et cochez la case « Exclure tous les appels provenant de robots connus » car ce n’est pas fait par défaut.
Créer un segment dans Google Analytics
Après en avoir essayé plusieurs, nous avons créé notre propre segment :
Ajouter un segment > importer à partir de la galerie. Choisissez notre segment « spam referrer filter. » par Darwin
Il est conçu pour filtrer une longue liste de spammeurs et nous la maintenons à jour sur la base des nombreux sites dont nous assurons le SEO.
Ou cliquez simplement sur ce lien pour ajouter le filtre à votre console Google Analytics.
Vous pouvez le mettre à jour par vous-même en ajoutant des OU source contient [URL du site référent à filtrer].
Nous avons volontairement élargi le champ d’action du filtre en visant une partie significative des URL. En effet, nos amis n’hésitent pas créer des sous-domaines, ajouter des chiffres dans les URL ou encore changer d’extension de domaine pour brouiller les pistes.
Avant / après :
Dans le cas extrême d’un site qui vient d’être lancé, les différences entre « toutes les sessions » (en bleu) et les données filtrées par le segment (en orange) sont impressionnantes.
Dans l’exemple qui suit, 2/3 des visites (sessions) proviennent de faux sites référents.
Bloquer les spammeurs à la source :
C’est la solution la plus durable, mais elle demande un peu plus de technique.
Notez que si elle va alléger un peu la charge du serveur d’hébergement, elle ne sera évidemment pas rétroactive.
Il reste donc utile d’utiliser un segment dans Google Analytics en complément.
Pour les sites hébergés sur un serveur Apache (l’immense majorité, donc), il s’agit d’éditer le fichier .htaccess de votre pour ajouter des règles de ce type :
En ajoutant autant de lignes que d’URL à bloquer.
Evidemment cette liste devra être tenue à jour.
Attention : le fichier .htaccess est un point extrêmement sensible sur un site web. Une mauvaise manipulation pourrait avoir des conséquences très fâcheuses, alors n’y touchez pas à moins de savoir ce que vous faites.
Cet article d’Alexis Rylko vous apportera un autre éclairage sur le sujet.
Vous trouverez ici un fichier .htaccess prêt à l’usage est très complet.
Une situation qui s’aggrave :
Il paraît que Google planche sur une solution intégrée pour endiguer ce fléau comme le montre ce post officiel. Souhaitons que la solution soit trouvée et mise en place et que cet article devienne obsolète. Mais pour le moment la situation semble s’installer et même s’aggraver.
De nouveaux faux sites référents continuent à apparaître chaque mois. Stu Bowker s’est courageusement proposé d’en tenir la liste à jour sur son Google+ avec l’aide de la communauté.
Début juillet 2015, il relevait qu’en à peine deux mois, 158 nouveaux domaines étaient apparus.
Quel cynisme !
Ce faux site référent nommé « how to stop referral spam .eu » m’a bien fait rire :
D’autant que le domaine redirige vers le site d’un spam referrer : iloveitaly ! Quel cynisme…
Update du 6 janvier 2015:
vous pouvez désormais appliquer en quelques clics un système de filtres avancés qui excluent plus de 400 faux domaines référents.
http://www.simoahava.com/spamfilter/
Cet outil est généreusement mis à disposition gratuitement par Simo Ahava, un talentueux finlandais que je remercie au passage!