Le Referrer spam dans Google Analytics: comprendre et combattre.

Dans la course effrenée au trafic Internet, certains ont jugé que tous les moyens étaient bons, éthique et loi étant des concepts sacrifiés à la course aux profits. Si le spam est synonyme pour beaucoup d’emails non sollicités et idiots, il existe d’autres actions de spammeurs pour vous matraquer avec ce qu’ils ont à promouvoir. Premier article d’une série d’analyses par Genious Interactive pour comprendre ces nuisances, et tenter de s’en protéger.

Vous ne le savez peut-être pas encore, mais une partie du trafic enregistré sur votre site par Google Analytics provient potentiellement de robots « Spammeurs ». Ces ressources fictives aux noms exotiques peuvent générer des centaines de visites, fausser nettement vos données Analytics comme le taux de rebond, la durée de visite, ou le nombre de visiteurs – et polluant votre tableau de bord.

Ces fausses sources de trafic sont ce que l’on appelle du « referrer spam », une manière d’injecter l’adresse d’un site dans un rapport de Google Analytic pour attirer du trafic.

Mais pourquoi tant de haine ? demanderez-vous légitimement.

Tout simplement pour vous tromper et vous inciter à visiter ces sites, sur lesquels se trouvent certainement des publicités ou liens sponsorisés à leur bénéfice – nous y reviendrons dans la partie « contre-attaque »…Le but n’est bien que de susciter la curiosité d’un webmaster, pour engendrer des visites même si c’est 1 sur des millions de spam, comme dans les pourriels.

On peut distinguer deux types de referrer spam : le ghost referrer spam et le crawl referrer spam.  Explications de ces nouveaux fléaux du Web, que détestent autant les propriétaires de sites que leurs prestataires en référencement.

Le Ghost Referrer Spam

Le ghost referrer spam représente la majeur partie du referrer spam. Aucun robot ne visite en fait votre site web (d’où le nom de ghost): les spammers utilisent le Measurement Protocol de Google pour aller directement marquer leurs infos  parasites dans votre compte Google Analytics.

L’outil de spam génère ainsi aléatoirement des identifiants de comptes Analytics (type UA-XXXXXX-X), et injecte ensuite ses fausses informations dans leurs comptes. Ce type de spam ne peut pas être bloqué via le .htaccess  car le .htaccess régie les accès à votre serveur, et le ghost spam referrer n’y met techniquement jamais les pied.

Vous pouvez détecter ce ghost referrer spam via Google analytics : dans Acquisition > Canaux > sélectionner « refferal »  puis ajouter en dimension secondaire « nom d’hôte ».

referrer spam

En rouge, on peut voir le ghost referrer spam. Comme il ne fait que générer des ID de tracking au hasard, sans même avoir idée du site qu’il touche, le nom d’hôte est toujours indiqué comme (not set). En jaune, on peut voir le crawl referrer spam, bloquable lui via .htaccess. Là il s’agit bien d’un robot qui lui vient parcourir votre site, techniquement  pas différent  des robots de moteurs de recherche légitimes, et il aura donc tendance à indiquer des noms d’hôtes valides.

Une autre manière de les détecter : identifier la page de destination en dimension primaire, et le nom d’hôte en dimension secondaire. La page visée sera toujours la home page, ou une page n’existant pas sur votre site.

Exemples sur le tableau de bord Google analytics de Genious Interactive :

fausses URLs

On vous rassure, la rubrique « torture » n’est pas à l’ordre du jour chez Genious Interactive.

home_spam

Une troisième manière de les détecter : se fier aux caractéristiques des visites laissées par ces spams.

fausses statistiques spam referrer

On peut voir ici que le taux de rebond est toujours de 100% ou de 0%, la durée moyenne des sessions de 0 seconde, et le pourcentage de nouvelles sessions de 100%.

Ces caractéristiques sont à prendre avec du recul, les spams progressant en intelligence, certains peuvent générer des statistiques de visites plus proches d’un comportement normal.

Nous pouvons également vous former à distinguer le spam du légitime.

Crawl referrer spam

Un crawler est un robot qui parcourt les sites web lien par lien, dans un but d’indexation, comme les robots de Google, qui va  lui  ensuite les proposer dans ses résultats de recherche.

Un crawl referrer spam va employer les mêmes méthodes, mais dans le but d’attirer du trafic sur son site. Il va ignorer toutes les règles contenues dans le fichier robots.txt censées indiquer comment les robots doivent se comporter sur votre site.

La principale différence avec le ghost referrer spam, c’est la présence de ces crawlers sur votre site, et donc la possibilité de les bloquer via le .htaccess au niveau de votre serveur d’hébergement, bien que les filtres Google Analytics fonctionnent aussi mais eux  a posteriori.

Pourquoi bloquer le referrer spam

Sur un site générant plusieurs milliers de visites par mois, quelques dizaines de faux visiteurs en provenances du referral spam ne changeront pas grand-chose. Mais sur un site au trafic plus modeste, ces quelques dizaines de visites peuvent rendre l’analyse marketing fastidieuse, et surtout mener à une interprétation erronée. En poussant la logique plus loin, le spam dans vos statistiques de site peuvent vous amener à prendre de mauvaises décisions pour votre organisation.

D’un point de vue plus technique, les crawls récurrents – et non désirés – d’un crawl referrer spam utilisent les ressources du serveur, ralentissant potentiellement  le chargement des pages et, par conséquent, augmentent le taux de rebond tout en faisant au pire baisser le positionnement du site dans les SERP. Ces conséquences sont la partie émergée de l’iceberg, leur crawl peuvent aussi repérer la version de CMS utilisée, les plugins, les vulnérabilités associées… et avoir des conséquences dramatiques sur la sécurité.

En plus des deux points évoqués, ces éditeurs de robots spammeurs contribuent à la pollution du web, avec les mails spams, les virus, les adwares… Bloquer ce type de pratique par principe ne peut que contribuer à rendre le web meilleur.

« Ok je comprends le principe agaçant, et on ne peut-on rien y faire ? » (Cri du coeur du gestionnaire de site Web)

Et bien si, du moins en partie, il est possible de réduire les conséquences pénibles de ces données  spammeurs. Dans un prochain article, nous vous indiquerons comment masquer le referrer spam de votre compte Analytics, voire bloquer le referrer spam. Si vous avez des questions ou commentaires, exprimez-vous ci-dessous !

Vous pouvez aussi découvrir notre prestation Google Analytics pour vous guider dans la configuration et l’exploitation de votre Google Analytics, y compris dans le blocage de ces spams.

Recent Posts

Laisser un commentaire