Glossaire

Corrélation

La corrélation se réfère à la relation statistique entre deux variables. Si deux variables X et Y sont corrélées, cela signifie qu'une variation de la variable X entraîne une variation de la variable Y. Il existe certes une relation réciproque, mais cela ne signifie pas que la variable X entraîne nécessairement la variable Y.

On fait la distinction entre une corrélation positive et une corrélation négative. Dans le cas d'une corrélation positive, les valeurs des deux variables augmentent ensemble. Ainsi, si les valeurs de la variable X augmentent, cela entraîne une augmentation de la valeur de la variable Y. Inversement, la corrélation négative signifie que lorsque les valeurs de la variable X augmentent, les valeurs de la variable Y diminuent. Un exemple de corrélation positive peut être le nombre d'heures passées à préparer un examen et la note obtenue. Si le temps investi augmente, on a tendance à obtenir de meilleurs résultats à l'examen. En revanche, il existe une corrélation négative entre le nombre d'heures de sommeil d'une personne et son niveau de stress. Si une personne dort moins, son niveau de stress augmente.

Dans le contexte scientifique, on rencontre souvent, outre la corrélation, le concept de causalité. Ces deux concepts sont souvent confondus ou assimilés l’un à l’autre. Cela peut conduire à des conclusions erronées. Une corrélation n'implique pas une relation de cause à effet (causalité). Ce n'est pas parce qu'il existe une corrélation entre deux variables qu'une variable entraîne nécessairement une modification de l’autre variable. Cette petite mais subtile différence est importante. Elle permet d’éviter de tirer des conclusions erronées des données.

L'exemple suivant explique la différence entre causalité et corrélation :
Pendant des décennies, le nombre de cigognes en Suisse a diminué en même temps que la fécondité de la population (nombre de bébés mesuré par rapport à la population). Il serait faux d'en conclure que la baisse des naissances chez l'homme est due à la diminution de la population de cigognes. Au lieu de cela, les deux résultats peuvent être expliqués de manière causale par d'autres causes qui se sont produites en même temps : l'augmentation de la prospérité due à l'industrialisation a entraîné une diminution de la taille des familles. Parallèlement, l'abandon des marais et l'urbanisation de nombreuses régions du Plateau ont réduit l'espace vital et l'offre de nourriture des cigognes.

Pour prendre des décisions, il est indispensable d'examiner les véritables relations de cause à effet.