Qu’est ce que le trafic bot ? | Comment arrêter le trafic bot

Le trafic bot est un trafic non humain vers un site Web. Bien qu’une partie du trafic bot soit bénéfique, le trafic bot abusif peut causer des perturbations.

Share facebook icon linkedin icon twitter icon email icon

Trafic bot

Objectifs d’apprentissage

Après avoir lu cet article, vous pourrez :

  • Définir le trafic bot.
  • Comprendre comment identifier le trafic bot.
  • Souligner les conséquences négatives des bots malveillants.
  • Découvrir comment arrêter le trafic bots.

Qu’est ce que le trafic bot ?

Le trafic bot décrit tout trafic non humain vers un site internet ou une application. Le terme de trafic bot a souvent une connotation négative, mais en réalité le trafic bot n’est pas nécessairement bon ou mauvais ; cela dépend entièrement de l’objectif des bots.

Certains bots sont essentiels pour les services utiles comme les moteurs de recherche et les assistants numériques (comme Siri, Alexa). La plupart des entreprises accueillent ce type de bots sur leur site.

D’autres bots peuvent être malveillants, comme ceux utilisés pour l’infiltration de comptes, l’extraction de données, et le lancement d’attaques DDoS. Même les « mauvais » bots les plus bénins, comme des robots d'indexation non autorisés, peuvent être une nuisance, parce qu’ils peuvent perturber les analyses du site et générer une fraude au clic.

On considère que 50 % de tout le trafic Internet est composé de trafic bot, et une part importante de ce trafic est du trafic malveillant. C’est pourquoi de nombreuses entreprises cherchent à gérer le trafic bot vers leur site.

Comment identifier le trafic bot ?

Les ingénieurs Web peuvent examiner directement les requêtes réseaux vers leur site et identifier le trafic probablement lié aux bats. Un outil d’analyse Web intégré, tel que Google Analytics ou Heap, peut aider à détecter le trafic bot.

Les anomalies analytiques suivantes sont caractéristiques du trafic bot :

  • Nombre anormal de consultations de page : Si un site connait un pic soudain, sans précédent et inattendu de consultations, il est probable que ce pic soit dû à des clics bots sur le site.
  • Taux de rebond anormalement élevé : Le taux de rebond identifie le nombre d’utilisateurs qui consultent une page d’un site puis le quittent sans aucun autre clic sur la page. Une augmentation inentendue du taux de rebond peut être le résultat de bots dirigés vers une page en particulier.
  • Durée de session étrangement longue ou courte : La durée de la session, ou le temps passé par les utilisateurs sur un site Web, devrait rester relativement stable. Une augmentation inexpliquée de la durée de session peut indiquer que des bots naviguent sur le site à une vitesse inhabituellement basse. À l’inverse, une diminution inattendue de la durée de la session peut être le résultat de bots cliquant sur les pages du site beaucoup plus rapidement qu’un utilisateur humain.
  • Conversions indésirables : Un pic de conversions fictives, telles que des créations de compte avec des adresses mail incompréhensibles ou des formulaires de contact envoyés avec des noms et des téléphones falsifiés, peut être causé par des bots qui remplissent des formulaires ou des spambots.
  • Pics de trafic depuis un emplacement inattendu : Un pic soudain du nombre d’utilisateurs dans une région donnée, et en particulier si peu de résidents de cette région sont pas susceptibles de parler couramment la langue du site, peut être une indication de trafic bot.

Comment le trafic bot peut-il nuire aux analyses ?

Comme mentionné précédemment, le trafic bot non autorisé peut influencer les mesures analytiques telles que le nombre de consultations, le taux de rebond, la durée de session, la géolocalisation des utilisateurs et les conversions. Ces écarts de mesure peuvent créer une importante frustration chez le propriétaire du site . il est extrêmement difficile de mesurer la performance d’un site submergé d’activité bot. Les tentatives d’amélioration du site, telles que les tests A/B et l’optimisation du taux de conversion, sont également mises à mal par le bruit statistique créé par les bots.

Comment filtrer le trafic bot par Google Analytics

Google Analytics offre l’option « d’exclure tous les recherches issues des bots et araignées connus » ( les araignées sont des bots de moteurs de recherche qui parcourent les pages Web). Si la source de trafic bot peut être identifiée, les utilisateurs peuvent également fournir une liste d’adresses IP spécifiques qui seront ignorées par Google Analytics.

Bien que ces mesures soient efficaces pour empêcher certains bots de perturber les analyses, elles n’arrêteront pas tous les bots. De plus, la plupart des bots malveillants poursuivent un autre objectif que la perturbation des analyses de trafic et ces mesures ne font rien pour atténuer l’activité nuisible des bots au delà de préserver les données d’analyse.

Comment le trafic bot peut-il nuire aux performances ?

L’envoi massif de trafic bot est une méthode fréquemment utilisée par les attaquants pour lancer une attaque DDoS. Pendant certains types d’attaques DDoS, une telle quantité de trafic de l’attaque est dirigée vers un site Web que le serveur d'origine est surchargé et que le site est ralenti voire totalement indisponible pour les utilisateurs légitimes.

Comment le trafic bot peut-il être négatif pour l’entreprise ?

Certains sites Web peuvent être financièrement mis à mal par le trafic bot malveillant, même si leur performance n’est pas affectée. Les sites qui s’appuient sur la publicité et les sites qui vendent des marchandises avec un stock limité sont particulièrement vulnérables.

Pour les sites qui diffusent des publicités, les bots qui arrivent sur le site et cliquent sur divers éléments de la page peuvent déclencher de faux clics d’annonce ; c’est ce que l’on appelle la fraude au clic. Cela peut provoquer initialement une augmentation des revenus d’annonces, mais les réseaux de publicité en ligne savent parfaitement détecter les clics de bots. S’ils suspectent qu’un site Web commet une fraude au clic, ils prendront des mesures, généralement en bannissant ce site et ses propriétaire de leur réseau. Ainsi, les propriétaires de sites hébergeant des annonces sont très prudents à l’égard de la fraude au clic par les bots.

Les sites dont les stocks sont limités peuvent être ciblés par les bots d’accumulation de stocks. Comme le suggère leur nom, ces bots se rendent sur les sites de eCommerce et placent de très grandes quantités de marchandise dans leur panier, les produits sont alors indisponibles pour les acheteurs légitimes. Dans certains cas, ces actions peuvent également déclencher un réapprovisionnement inutile du stock auprès du fournisseur ou du fabricant. Les bots d’accumulation de stocks ne font jamais d’achat, ils sont simplement conçus pour perturber la disponibilité du stock.

Comment les sites Web peuvent-ils gérer le trafic bot ?

La première étapes pour arrêter ou gérer le trafic bot vers un site Web est d’inclure un fichier robots.txt. Il s’agit d’un fichier qui fournit des instructions pour que les bots qui parcourent la page, et il peut être configuré pour empêcher les bots de consulter ou d’interagir complètement avec la page. Il est cependant à noter que seuls les bons bots obéissent aux règles d’un fichier robots.txt ; il ne peut pas empêcher les bots malveillants de parcourir le site Web.

Un certain nombre d’outils peuvent aider à atténuer le trafic bot abusif. Une solution de Rate Limiting peut détecter et empêcher le trafic bot originaire d’une seule adresse IP, bien qu’une grande partie du trafic bot malveillant sera négligée. En plus du Rate Limiting, un ingénieur réseau peut examiner le trafic d’un site et identifier les requêtes réseau suspectes, pour fournir une liste d’adresses IP à bloquer par un outil de filtre tel qu’un WAF. Il s’agit d’un processus très fastidieux qui n’arrête qu’une partie du trafic bot malveillant.

À part le Rate Limiting et les interventions directes d’un ingénieur, la façon la plus efficace et la plus facile d’arrêter le trafic des mauvais bots est d’utiliser une solution de gestion des bots. Une solution de gestion des bots peut tirer parti de l’intelligence et utiliser l’analyse comportementale pour arrêter les bots malveillants avant qu’ils n’atteignent votre site Web. Par exemple, la Gestion des robots malveillants par Cloudflare utilise l’intelligence de plus de 13 millions de propriétés Internet et applique le machine learning pour identifier et arrêter les bots abusifs de façon proactive.