Le point sur les différences énormes entre les outils de statistiques

Pin It

Les outils de statistiques de monitorage de sites Web, ont des différences énormes entre elles. Afin de vous montrer ces disparités et de tenter de les expliquer, j’ai dressé le tableau du nombre de visites uniques sur ce blogue pour le mois de juillet 2006. Voici donc le portrait avec une seule donnée, identique pour tous.

Tableau de comparaison statistique de différents outils, juillet 2006
Tableau de comparaison statistique de différents outils, juillet 2006

Pourquoi ces énormes différences?

Il existe deux types de statistiques Web. La première (Webtrends, Webaliser) est une statistique issue du serveur Web qui diffuse votre site Web et est en fait une lecture des fichiers logs de celui-ci. La deuxième (Google Analytics, Performancing) est une statistique issue d’un serveur distant qui enregistre les impressions de votre page, lorsque le témoin de cet outil, généralement imbriqué dans le code de votre sidebar, active le serveur distant. Les différences énormes de chiffres, viennent du fait que le premier type est trop précis et enregistre toute l’activité sur votre site, incluant la visite d’araignées (bots)des engins de recherches, les pigns d’outils RSS et les autres visites de moteurs qui ne sont pas réellement des visiteurs. Le deuxième type de statistiques, quant à lui, n’est pas assez précis et ne comptabilise pas entre autres, les lecteurs de fils RSS bien humain, qui peuvent s’intéresser à votre contenu. De plus, les possibilités de problèmes de connexions entre le serveur du fournisseur de service Internet de votre visiteur, le serveur de diffusion de votre site Web et celui du service statistique de votre témoin sont grandement accrues. Finalement, si vous avez une longue page à télécharger (ce qui est mon cas) et en fonction de la hauteur à laquelle est positionné votre témoin, il est possible qu’un visiteur ai eu le temps de lire l’entièreté du billet qui l’intéresse, soit rendu à un autre site et que le témoin n’a pas eu le temps de se télécharger, de se brancher à son serveur distant et de comptabiliser comme visite. Comme vous pouvez aussi le remarquer, même entre statistiques de type identique, il existe une différence.

Où se trouve la vérité?

La vérité se trouve entre les deux types de statistiques. Donc en fait, comme ni l’un ni l’autre type de statistique n’est vraiment précis (dans le sens de fournir le nombre exact de visiteurs réellement humains), la vérité serait sans doute la moyenne entre les deux types de données qui dans ce cas-ci se situe à 19825 visiteurs uniques pour ce blogue en juillet 2006. Vous remarquerez d’ailleurs que lorsque je vous donnais mes statistiques mensuelles, je prenais le soin de vous en indiquer la source. Vous devriez toujours d’ailleurs vous enquérir de celle-ci lorsque quelqu’un vous donne des chiffres de fréquentation d’un site. Mais pourquoi alors avons-nous besoin de plusieurs outils statistiques? Vous devriez à tout le moins avoir au moins l’un des deux types d’outil statistiques afin d’avoir un portrait plus juste de votre fréquentation. De plus, chaque outil vous offre des données complémentaires, mais inédites. Par exemple, la granularité (c’est-à-dire le détail du détail des référents par exemple, vous permettant de les identifier et de les remercier) de Google Analytics fait de cet outil une mine de renseignement précieux. Quant à Webtrends ou Webaliser, ils identifient spécifiquement l’adresse IP et/ou l’URL des visiteurs récurrents, vous permettant ainsi d’identifier les vampires de contenus qui pourraient se servir de vos contenus sans pour autant vous générer de trafic comme dans l’exemple des spammeurs et vampires de sites tels que Centre d’appels JL dont je vous ai déjà parlé et dont Éric Baillargeon a expliqué la démarche vampiriste, dans les commentaires.

Imprimez ce billet Imprimez ce billet

Commentaires

  1. Houssein

    Ah, j’avais pas lu ce billet avant de poster mon commentaire sur l’article précédent ! 🙂
    T’as tout expliqué ici.

  2. VEDOCCI » Blog Archive » Les différences énormes entre les outils de statistiques

    […] Selon l’outil utilisé, les statistiques de fréquentation d’un blog ou d’un site peut varier énormément. Michel Leblanc se penche sur le problème et émet des hypothèses d’explications : […]

  3. Eric Baillargeon

    Je dirais que la vérité est beaucoup plus près de Google Analytic que des logiciels d’analyse de log.

    Webtrends ne permet pas de supprimer les foutus robots indésirable car ils sont “hardcoder” dans un dll. C’est idiot, il aurait dû nous permettre de mettre ça dans un fichier .ini.

    En 2005 WebmasterWorld a totalement couper l’accès à tous les robots (http://www.webmasterworld.com/robots.txt). Brett Tabke à eu toute une surprise alors ! 90% du traffic et de la bande passante était dû aux robots indésirables.

    Essai ceci Michel sur ton site (http://www.webmasterworld.com/robots3). Ce n’est pas la façon définitive que Brett a employé (il utilise un cgi plus poussé), mais ceci devrait faire un bon petit ménage dans tes logs !

  4. Les différences parmi les outils de statistiques

    […] Or ce matin je suis tombé sur ce billet de Michel Leblanc qui explique les différences entre les outils statistiques. Michel explique le tout bien mieux que je ne pourrais le faire. Je vous invite donc à lire son billet. 😉 […]

  5. Outils statistiques Web, un comparatif est disponible | Michel Leblanc, M.Sc. commerce électronique. Marketing Internet, consultant, conférencier et auteur

    […] publie une étude exhaustive de différents engins de mesures statistiques Web. J’ai déjà expliquer les différences énormes entre les deux grandes… idéalement ça vous prend les deux types d’outils. Mais lesquels choisir? Le […]

  6. Deux mois de BossaNovaBrasil | Bossa Nova Brasil

    […] un peu particuliers ! La blogueuse canadienne Michelle Blanc a écrit un post bien documenté sur ce sujet, cher à mes frères […]

  7. Pinterest, le spam publicitaire poche a commencé + du trafic ? Vraiment ? • Michelle Blanc, M.Sc. commerce électronique. Marketing Internet, consultante, conférencière et auteure

    […] pas une. J’avais déjà expliqué ce phénomène, il y a plusieurs années, dans mon billet Le point sur les différences énormes entre les outils de statistiques. Donc lorsque je lis la « supposée influence de trafic » majeure de Pinterest, je me demande si […]