Lun. au mer., 10h-16h, H de l'Est
1.855.281.5499 (sans frais)

L'analyse de données à la portée de tous !

Reporting & Dashboards
Il existe de nombreux outils dédiés à l'analyse de données : certains sont extrêmement sophistiqués, et d'autres sont plutôt simples à utiliser et à configurer. Si vous êtes prêt à entreprendre un tout petit effort pour prendre de meilleures décisions à l'aide de vos données, il vous suffit juste de vous replonger dans une bonne vieille feuille de calcul. Les tableurs disposent de beaucoup d'outils d'analyse de données, et je voudrais vous parler aujourd'hui d'une fonctionnalité peu connue (d'après mon impression), mais extrêmement puissante : les tableaux croisés dynamiques ! 

Les tableaux croisés dynamiques sont inclus dans la plupart des tableurs que vous pouvez utiliser (cette fonctionnalité a même été ajoutée récemment à celui de Google Docs). Dans ce billet toutefois, je me concentrerai sur Excel 2010 puisque c'est celui dont je me sers le plus en ce moment. Les tableaux croisés dynamiques vous faciliteront la vie si vous avez des grands tableaux de données, simples et complets, et que vous souhaitez établir des liens entre les différents types de données (au-delà de ce que vous pouvez faire avec des filtres et du tri). Ils peuvent constituer notamment un excellent moyen d'explorer vos données si vous ne savez pas bien encore ce que vous cherchez.

Mise en situation : suivi des demandes de dons

Afin d'illustrer ma présentation, je vais vous donner un exemple nous concernant directement à TechSoup Canada : le suivi des demandes de produits dans le cadre de notre programme de dons. Je peux exporter ma base de données pour obtenir une belle grosse feuille de calcul, dans laquelle chaque ligne représente un produit commandé.

J'ai bien évidemment retiré un grand nombre de données (comme le nom des organisations, leurs coordonnées et les produits qu'elles ont commandés), mais j'ai conservé d'autres informations telles que le type d'organisation à l'origine de la commande (c'est-à-dire la nature de sa mission principale), la province dont elle est originaire, le nombre de licences commandées (une commande peut compter par exemple 5 licences de Microsoft Office) et la date de demande.

Spreadsheet of order data

Si je veux connaitre par exemple le nombre de commandes passées dans un mois donné, la procédure est assez simple. Il me suffit d'utiliser le filtre automatique d'Excel pour filtrer le mois et l'année voulus, puis de compter le nombre de lignes.

Question no 1 : de quelle province recevons-nous le plus de commandes ?

Mais comment faire si je veux réaliser quelque chose de plus complexe ? Mettons que je veuille savoir quelle est la province où le plus de commandes sont passées. Je pourrais me débrouiller en procédant à quelques tris et comptages, mais cela demanderait beaucoup de travail manuel. C'est là que les tableaux croisés dynamiques viennent à la rescousse ! Je sélectionne les données qui m'intéressent (ici, tout mon tableau, c'est-à-dire toutes les lignes et toutes les colonnes), puis je clique sur Insertion -> TblCroiséDynamique.

Si vous n'avez jamais utilisé de tableaux croisés dynamiques auparavant, la fenêtre qui s'affiche maintenant peut paraitre assez déroutante :

New pivot table

Pas de panique ! Ce qu'il faut que vous fassiez c'est d'essayer d'imaginer le rapport que vous souhaitez, puis de faire glisser les champs se trouvant dans la liste à droite vers le bon emplacement dans le tableau ou dans les cases à droite.

Si vous avez du mal à deviner ce qui va où, faites des essais et voyez si le résultat est pertinent. Je vais reformuler le problème selon les termes du cas que je vous présente : Je veux savoir quelle province compte le plus grand nombre de licences commandées au total.

Je commence par faire glisser « Province » vers « Row Labels » (Étiquettes de lignes), de sorte à obtenir une liste de toutes les provinces, puis je fais glisser « QTY » (Quantité) vers « Values » (Valeurs). Par défaut, c'est le nombre de lignes qui est pris en compte. Je vais donc dans le menu Paramètres des champs de valeurs (après un clic droit sur le champ QTY) et je sélectionne Somme. J'ai maintenant devant moi une liste de toutes les provinces et le nombre total de licences commandées dans chacune d'elles.

C'est intéressant, mais il n'est pas facile de trouver quelle province est la plus demandeuse. Donc, ce que je vais faire c'est cliquer sur la petite flèche à côté de « Province » (en en-tête du tableau), et choisir « Options de tri supplémentaires ». En y regardant de plus près, je vois que je peux choisir « Descendant (de Z à A) » et sélectionner « Somme de QTY », ce qui va trier les provinces par ordre décroissant selon le nombre de licences commandées. En d'autres termes, la province ayant commandé le plus de licences se trouve en haut de la liste :

Number of licenses ordered by province

Sans surprise, c'est l'Ontario qui a généré le plus de commandes. C'est un résultat prévisible car il y a beaucoup d'associations, d'organisations caritatives et de bibliothèques en Ontario. Toutefois, cela signifie aussi que nous devons communiquer plus auprès des autres provinces au sujet de notre programme de dons. Nous pouvons ainsi utiliser ces données pour appuyer nos efforts de communication et veiller à ce que notre temps soit utilisé plus efficacement, là où cela est le plus nécessaire.

Question no 2 : durant quel mois recevons-nous le plus de commandes ?

Comme c'est plutôt amusant, procédons à un autre exemple. Cette fois, je veux afficher une tendance du nombre de commandes par mois, afin de voir durant quels mois nous en recevons le plus. Là encore, je vais sélectionner toutes mes données dans la feuille de calcul principale, mais cette fois je vais utiliser la toute nouvelle fonctionnalité d'Excel, le « Graphique croisé dynamique », en cliquant sur Insertion -> Graphique croisé dynamique (dans le menu déroulant TblCroiséDynamique).

Comme précédemment, je vais paramétrer le tableau de sorte à afficher les données comme je le souhaite. Mais étant donné que j'ai choisi l'option Graphique croisé dynamique, Excel va aussi construire à partir de mes données un diagramme explicitant la tendance.

New pivot chart

Puisque je veux voir le temps en abscisse, je vais faire glisser « Year » (Année) et « Month » (Mois) vers la zone « Axis Field » (Champs Axe). Sachant que c'est le nombre de commandes qui m'intéresse, je fais glisser « QTY » vers « Values ». Je constate que ce champ est automatiquement réglé pour compter les valeurs au lieu d'en faire la somme, ce qui correspond à ce que je veux ici (je veux connaitre le nombre de commandes, et non pas le nombre de licences). J'obtiens alors un tableau avec les valeurs en question, ainsi qu'un graphique :

Bar chart showing orders by month

 

Le résultat est engageant, mais un histogramme (graphique par défaut) n'est pas vraiment la meilleure façon d'afficher une tendance au fil du temps. Je vais plutôt opter pour un graphique en courbe. Je vais également nettoyer un peu le graphique pour le rendre plus facile à lire. 

Line chart of orders by month

Je peux désormais voir clairement apparaitre certaines tendances dans mes données. Par exemple, on voit que des pics de commandes ont lieu en mars et en juin dans les 3 années présentées ici. Si je fais le lien avec mes propres connaissances sur le secteur et le programme de dons, je sais que le 31 mars correspond à la fin de l'année fiscale de nombreux associations, et que de nombreux programmes de nos donateurs réinitialisent leurs limites d'attribution à la fin juin. Maintenant que j'en sais plus grâce à ces données, je peux commencer à prendre des décisions comme augmenter le temps du personnel dédié au service clients durant ces mois-là.

Tout ceci ne constitue bien sûr qu'une analyse superficielle, et il existe bien d'autres manières de triturer ces données. Comme évoqué au début de ce billet, en étant capable de jongler avec vos données vous pourrez découvrir des tendances et les meilleures façons de représenter vos données. Cela vous aidera en fin de compte à être mieux informés et à mieux décrire votre organisation par le biais de données.

Avez-vous utilisé des tableaux croisés dynamiques ? Quels sont les méthodes/outils d'analyse de données que vous jugez utiles ?