Disparités de données
Si vous constatez des disparités dans les données, comparez les données au niveau des pages vues, et pas au niveau des sessions. Pourquoi ? La définition d'une "session" varie considérablement entre Google Analytics et Contentsquare, tandis que les définitions des "pages vues" sont plus proches d'un outil d'analyse à l'autre (les principales différences proviendront des vues de pages artificielles qui peuvent être suivies d'un côté et pas de l'autre).
Si je constate des disparités de données, quand dois-je ouvrir un ticket ?
Vous pouvez ouvrir un ticket de support pour que les disparités soient examinées si :
-
L'écart de données observé au niveau des pages vues est > 10% et/ou
-
L'écart de données observé au niveau des sessions est > 20%
Quelle est la différence entre les "sessions" de Contentsquare et les "sessions" de Google Analytics ?
-
CS considère qu'une session prend fin après 30 minutes d'inactivité à partir du dernier évènement ou de la dernière action utilisateur. GA, lui, permet aux utilisateurs de modifier ce paramètre (de quelques secondes à plusieurs heures).
-
GA commence une nouvelle session à minuit (dans le fuseau horaire de la propriété Google), indépendamment de la règle des 30 minutes mentionnée ci-dessus. Imaginons donc qu'une vraie session commence à 23h00 et se termine à 01h00 le lendemain : cette session sera divisée en 2 sessions dans GA, ce qui n'est pas le cas dans CS.
-
GA commence également une nouvelle session lorsque la source de la campagne change : si un utilisateur arrive sur une page via une première campagne, quitte la page et y revient par le biais d'une autre campagne, alors la visite sera divisée en 2 sessions dans GA, mais pas dans CS.
Pourquoi y a-t-il des disparités de données dans Contentsquare ?
Des divergences peuvent apparaître pour plusieurs raisons :
- Problèmes de tag CS dans la collecte de données
- Exemple : extensions de bloqueur de publicités, problèmes de réseau, le tag n'est pas appliquée aux sous-domaines ou aux pages 404 tandis que GA est appliqué à l'ensemble du site, ou une politique de cookies qui repose sur l'acceptation de l'utilisateur final du site.
- Échantillonnage de Google Analytics
- Si le trafic de votre vue GA cible est supérieur à 1 million de sessions par jour, Google échantillonne automatiquement votre trafic avant d'exécuter la requête de segmentation. Cet échantillonnage empêchera l'obtention de données précises pour vos segments GA dans Contentsquare, même si l'intégration peut être très utile pour comprendre les tendances, et ce même avec l'échantillonnage.
- Vous pouvez réduire le trafic associé à la vue GA associée à votre intégration pour contourner ce problème.
- Différences dans l'implémentation des tags
- Le tag Contentsquare est appelé après ou avant le tag GA (chaque seconde peut ajouter un écart de 3 points).
- La nature du tag peut être différente (synchrone/asynchrone).
- Un tag peut être déclenché avant l'acceptation des cookies tandis que l'autre est déclenché après (idéalement, ils devraient tous deux être déclenchés une fois que les cookies sont acceptés).
- Différences de périmètre
- Les navigateurs compatibles sont différents. Exemple : CS garantit uniquement l'exécution du tag sur Internet Explorer 11+
- La propriété que vous utilisez dans GA n'est pas sur le même périmètre que CS (différents domaines, sous-domaines, inclusion/exclusion des environnements de pré-production...)
- Les filtres appliqués dans les deux outils peuvent être différents (en particulier sur les adresses IP).
- Les règles d'exclusion des bots peuvent être différentes et non partagées.
- Les méthodes d'échantillonnage diffèrent.
- Le fuseau horaire peut être différent et avoir un impact sur les données journalières, en particulier sur les transactions. Les données CS sont enregistrées en heure UTC.
- Les deux outils utilisent l'agent utilisateur du navigateur pour définir le device (desktop/tablette/mobile), mais ils n'utilisent pas la même bibliothèque, ce qui peut entraîner des écarts sur certains appareils spécifiques (notamment les mobiles).
- Différences dans le calcul des métriques
- Définition de session : CS considère qu'une session prend fin après 30 minutes d'inactivité après le dernier évènement / action utilisateur, tandis que GA permet à ses clients de modifier ce paramètre. La méthode d'échantillonnage et l'exclusion des adresses IP peuvent également avoir un impact sur le nombre de sessions mesurées sur une période donnée.
- Durée de session et temps passé sur la page de sortie : CS collecte toutes les interactions sur une page et la fin de la session correspond à l'horodatage du dernier lot d'événements envoyé. Ce n'est pas le cas dans GA où le temps passé dépend des événements personnalisés configurés sur la page de sortie.
- Définition du taux de rebonds : CS définit le taux de rebonds comme le pourcentage d'utilisateurs n'ayant vu qu'une seule page. Dans GA en revanche, seuls les utilisateurs qui ne déclenchent aucun événement suivi sur la page d'entrée sont considérés comme des rebonds.
- Temps de chargement : CS calcule le temps de chargement à partir du moment où le DOM devient interactif. La définition de GA du temps de chargement de la page prend en compte l'ensemble de la chronologie du chargement de la page, ce qui inclut quelques étapes de plus par rapport au moment où le DOM est prêt. Cela signifie que notre temps de chargement est inférieur à celui de GA.
- Transactions : CS compte le nombre de visites avec une transaction, tandis que GA compte le nombre de transactions.
- Revenu : Une transaction effectuée dans une devise différente de celle configurée dans CS (€) n'est pas convertie. Le revenu peut donc être plus élevé ou plus bas dans GA.