Skip to content

L’antisèche #5 – C’est quoi les liens de causalité et de corrélation ?

Less than 1 minute Minutes

L’antisèche c’est une série d’articles qui synthétise des grandes thématiques produit pour vous éviter d’être à sec en entretiens, réunions, soirées mondaines et rendez-vous galants !

Aujourd’hui on aborde le thème des « liens de causalité et de corrélation ».

Qu’est ce que c’est ?

illustration antisèche #5 IKXO issue de The Merovingian, Matrix Reloaded (2003)
Causality, there is no escape from it. We are forever slave to it. Our only hope, our only peace is to understand why? »
The Merovingian, Matrix Reloaded (2003)

Causalité et corrélation sont deux notions clés qui ne concernent pas exclusivement le monde du produit (ex : la physique, la biologie, la médecine, l’économie, la philosophie…) et qu’il est utile de connaître et de distinguer en tant que Product Manager lorsque vous analysez des données :

  • 2 variables alpha et beta ont un lien de corrélation si elles évoluent de manière coordonnée :
    • On parle de corrélation positive si ces 2 variables évoluent dans le même sens (ex : quand alpha croît, beta aussi)
    • On parle de corrélation négative si ces 2 variables évoluent dans le sens opposé (ex : quand alpha croît, beta décroît)
  • 2 variables alpha et beta ont un lien de causalité si une variable a un effet direct prouvé sur l’autre (ex : c’est l’évolution d’alpha qui gouverne directement celle de beta)

Plusieurs remarques :

  • La corrélation est un objet mathématique statistique que l’on peut calculer (le fameux coefficient de corrélation r) contrairement à la causalité qui n’est pas quantifiable
  • Corrélation et causalité ne sont pas équivalentes :
    • Un lien de causalité implique un lien de corrélation : si alpha cause beta, alors il existe un lien de corrélation entre alpha et beta
    • Mais un lien de corrélation n’implique pas nécessairement un lien de causalité

Or, le raccourci intellectuel est souvent pris à tort de considérer un lien de corrélation comme un lien de causalité, on parle d’effet cigogne : une corrélation entre le nombre de cigognes et le nombre de naissances dans une ville n’implique pas que les bébés proviennent des cigognes !

Il s’agit d’être vigilant vis à vis de nos biais cognitifs. Notre monde est complexe, plusieurs cas de figures existent pour nos 2 variables alpha et beta, parmi lesquels :

  • alpha cause beta
  • beta cause alpha
  • gamma cause alpha et beta, la variable gamma est appelée variable de confusion
  • alpha et beta ne sont pas liées, il s’agit d’une coïncidence

En quoi est-ce utile ?

En tant que PM, vous devez certainement analyser des données, a minima pour comprendre comment est utilisé votre produit. Distinguer les liens de causalité et de corrélation entre ces données vous permettra d’éviter de :

  • Vous tromper dans l’analyse de données
  • Dresser des conclusions erronées
  • Prendre des mauvaises décisions
  • Adopter une mauvaise stratégie
  • Miser sur les mauvaises fonctionnalités

Comment procéder ?

Soyez vigilant en tant que PM lorsque vous analysez des données et prenez votre temps avant de dresser des conclusions ou de prendre des décisions trop hâtivement.

Par exemple, le fait que votre NPS monte peu de temps après la mise en production d’une nouvelle fonctionnalité, n’est peut-être qu’une coïncidence ou est peut-être lié à un autre élément (ex : une campagne marketing) : pour établir un lien de causalité, il vous faudra investiguer davantage !

Autre exemple, lorsque vous êtes en train de concevoir une fonctionnalité avec votre équipe et que vous hésitez entre 2 versions (A et B), afin de choisir celle qui causera les meilleures performances (clics, taux de conversion…) un A/B test rigoureusement mené peut vous aider à y voir plus clair et éliminer les biais.

Quelques conseils pour cet A/B test :

  • Constituez deux lots d’utilisateurs de manière aléatoire (pour éviter des biais de sélection) et suffisamment peuplés (pour être suffisamment représentatifs)
  • Soyez raisonnable dans le nombre d’éléments que vous souhaitez comparer entre les versions A et B : celles-ci ne doivent pas grandement différer, sinon le bilan ne sera pas clair et net
  • Essayez de lisser l’influence des facteurs environnementaux sur les résultats du test, comme la saisonnalité et les événements majeurs
  • Vérifiez si vous avez une différence significative dans les métriques que vous souhaitez impacter entre les deux lots, car une différence marginale peut être le simple fruit du hasard

Quelques exemples

Vous avez besoin d’inspiration pour mettre le pied à l’étrier ?

Le site Spurious Correlations recense une panoplie de corrélations trompeuses et vous pourrez notamment trouver en bas du site des raisons pour lesquelles celles-ci semblent si convaincantes. Voici un exemple ci-dessous qui fait sourire : la corrélation entre la distance séparant Jupiter du soleil et le nombre de secrétaires en Alaska.

Exemple issu du site Spurious correlations : la corrélation entre la distance séparant Jupiter du soleil et le nombre de secrétaires en Alaska.

Établir une causalité entre ces deux variables pourrait amener à ce genre d’explications : “À mesure que la distance entre Jupiter et le soleil augmente, la force gravitationnelle exercée sur la Terre fluctue, ce qui entraîne une augmentation des ondes de productivité cosmique. Lorsqu’elles atteignent l’Alaska, ces ondes ont un effet magnétique sur l’afflux d’énergie des secrétaires, ce qui incite un plus grand nombre de personnes à faire carrière en Alaska en tant que secrétaires professionnelles. C’est comme un appel céleste à l’excellence en matière de secrétariat au pays du soleil de minuit.”

Les exemples ne manquent pas et ne sont pas circonscrits au monde du produit.

L’un des exemples les plus marquants et les plus riches d’enseignements est raconté par Allan Savory dans un TED Talk à propos de la désertification. Plusieurs décisions historiques pour l’enrayer se sont avérées désastreuses et ont montré que les causes de cette désertification n’avaient pas été correctement identifiées.

Une mise en situation

Dès lors qu’il s’agit de prendre une décision structurante pour votre produit ou votre organisation, mettez-vous dans la peau du médecin légiste Philippe Boxho ou du jury n°8 dans le film 12 Angry Men (Douze hommes en colère) et analysez avec pragmatisme la situation. Méfiez-vous des apparences, posez-vous un maximum de questions, posez des hypothèses, confirmez ou infirmez ces hypothèses et ainsi vous optimiserez vos chances de viser juste !

I am just saying a coincidence is possibleThe Jury n°8, 12 Angry Men (1957)

Pour aller plus loin

Les occasions pour être à côté de la plaque en interprétant des données sont nombreuses. Connaître ces liens de causalité et de corrélation et savoir les différencier est incontournable dans les métiers du produit, en particulier pour les data product managers. Nous espérons que cette antisèche vous donne envie d’explorer davantage.

Voici quelques pistes pour aller plus loin :

À vous de jouer !

Cet article vous a plu ? Allez vite découvrir les deux antisèches précédentes : C’est quoi la dette technique ? et C’est quoi une base de données ?

© IKXO 2024 – Mentions Légales

Site Créé par DOPE