Prédire l’achalandage de son site Web tout en évaluant sa performance

Depuis quelques temps, une idée me trottait dans la tête. J’ai toujours trouvé que l’achalandage de notre site Web varie de façon généralement prévisible en fonction de différents événements banals comme le jour de la semaine ou la publication d’un billet de blogue. Le site semble aussi connaître une croissance relativement stable dans le temps. Dans un excès de curiosité, j’ai donc décidé de valider statistiquement mes hypothèses. Voici le résumé de l’aventure…

Comment j’ai fait

Comme la variable à prédire est un chiffre variant de zéro à l’infini, c’est-à-dire les visites quotidiennes (je doute qu’on réussisse un jour à obtenir un nombre infini de visites, mais on vise haut!), j’ai construit un modèle de régression ayant pour variable indépendante le nombre de visites par jour. J’ai extrait les données de la dernière année à partir de notre compte Google Analytics. J’ai ensuite identifié les éléments qui pourraient faire varier l’achalandage. Au final, je me suis surtout retrouvé avec des variables binaires (ex : 1 = un billet de blogue a été publié ce jour-là ou 0 = aucun billet n’a été publié ce jour-là). Le modèle obtenu explique environ 50% de la variance dans le nombre de visites par jour. Ce n’est pas énorme, mais ce n’est pas mauvais pour un modèle encore en construction!

Les variables que j’ai considérées

D’abord, il faut savoir que notre site a été lancé en mars 2012. Comme il est certainement encore dans sa phase de croissance, il était logique que je considère l’âge du site comme une variable qui pourrait possiblement expliquer l’achalandage. J’ai donc créé une variable « âge du site » en jour.

Il a toujours été évident pour notre équipe que le blogue générait une part importante du trafic vers notre site. En fait, notre site connait toujours une augmentation notable de son achalandage les jours où nous publions nos billets. Nous avions aussi comme intuition que cette augmentation se maintient quelques jours après la publication. J’ai donc créé des variables pour les trois premiers jours d’une publication de billet. Nous nous sommes aussi souvent demandé si nous étions mieux de publier nos billets en matinée ou en après-midi. J’ai donc aussi ajouté une variable à cet effet.

Nous nous doutons d’ailleurs que ce n’est pas tous les billets qui connaissent le même succès. Pour cette raison, j’ai classé les billets en différents thèmes (ex : médias sociaux, comportement du consommateur, etc).

Ensuite, j’ai considéré le jour de la semaine puisqu’un coup d’œil sur notre tableau de bord de Google Analytics est suffisant pour voir qu’il ne se passe pas grand-chose la fin de semaine.

J’ai aussi noté les jours où nous avions des événements spéciaux comme les conférences qu’ont données les membres de l’équipe.

Les résultats

Ce qui est particulièrement intéressant de la démarche, c’est qu’elle nous permet non seulement de prédire l’intensité de l’achalandage mais aussi d’identifier les facteurs les plus importants de cet achalandage. D’abord, voici les éléments qui ne se sont pas avérés avoir un impact notable.

Les éléments à impact négligeable

La publication en matinée ou en après-midi

Cela n’a pas vraiment d’impact, c’est-à-dire que de façon générale, il n’y a pas vraiment de différence de performance selon qu’un billet a été publié en après-midi ou en matinée. Ceci dit, on doit garder en tête que si nous avions poussé la précision jusqu’à tenir compte de l’heure, les résultats auraient pu être différents.

Événements spéciaux

Les événements ont eu un impact négligeable sur le trafic sur le site. C’est un peu décevant, mais il faut savoir que nous n’avons pas toujours systématiquement noté les dates de nos événements spéciaux dans notre compte Google Analytics. Il se peut que nous n’ayons pas le portrait complet à ce niveau. Je tire quand même deux conclusions de ce résultat : 1) notre marque et/ou site n’est pas très mise en valeur lors de nos événements spéciaux et 2) en moyenne, la portée de nos événements spéciaux n’est peut-être pas encore suffisamment grande pour avoir un impact significatif sur notre site, mais nous y travaillons.

Les éléments à l’impact notable

La publication d’un billet

Sans surprise, c’est la variable ayant l’impact le plus fort sur l’achalandage. Les chiffres démontrent d’ailleurs que l’effet d’une publication se fait sentir pendant deux jours avant de s’estomper. L’effet est négligeable le troisième jour.

Les thèmes des billets publiés

Les thèmes ont aussi un impact important, certains étant plus populaires que d’autres. Dans notre cas, les deux thèmes les plus populaires auprès de notre auditoire sont les médias sociaux et l’optimisation et l’évaluation de sites Web.

L’âge du site

Cette variable a aussi un impact important, c’est-à-dire que plus notre site « vieillit », plus le nombre de visites est élevé. On peut s’attendre à ce que cette tendance se maintienne dans le futur.

Les jours de la semaine

D’abord, comme nous en étions sûrs, les samedis et dimanches, l’achalandage diminue de façon importante. C’est quand même moins pire le dimanche. Les lundis et vendredis sont aussi plus tranquilles. Nous n’avons pas noté de différence significative entre le mardi, mercredi et jeudi.

Est-ce que ça en a valu la peine?

Cet exercice nous a permis de mieux comprendre ce qui faisait « vivre » notre site Web. Nous n’avons pas le contrôle sur toutes les variables, mais en identifiant celles sur lesquelles nous en avons, nous pourrons accélérer la croissance de notre achalandage. Nous savons maintenant quels sont les jours les plus propices à publication de billets de blogue. Nous savons aussi quels sont les thèmes les plus populaires auprès de nos visiteurs. Évidemment, l’achalandage n’est pas la conversion. Ceci dit, la façon de faire que nous proposons pourrait éventuellement se prêter à la prévision de la conversion.