On pourrait penser maintenant que nous pourrions dire sans équivoque ce qui cause quoi. Mais la question de causalité ou corrélation , qui hante la science et la philosophie depuis leurs débuts, nous talonne toujours pour de nombreuses raisons.
Les humains sont prédisposés au cours de l’évolution à voir des modèles et psychologiquement enclins à recueillir des informations qui soutiennent des points de vue préexistants, un trait connu sous le nom de biais de confirmation. Nous confondons coïncidence et corrélation, et corrélation et causalité.
Contenu
La différence entre causalité et corrélation est que dans une relation causale, un événement est directement responsable d'un autre, tandis que dans une corrélation, deux événements existent simultanément, mais leur relation peut être due à une troisième variable.
Il est faux de dire que la corrélation implique la causalité. Pour que A provoque B, nous avons tendance à dire qu'au minimum :
Toutefois, prises isolément, ces trois exigences ne peuvent constituer une cause ; ils sont, comme le disent les philosophes, nécessaires mais pas suffisants. Quoi qu'il en soit, tout le monde n'est pas d'accord avec eux.
En parlant de philosophes, David Hume a soutenu que la causalité n'existe dans aucun sens prouvable [source :Cook]. Karl Popper et les falsificationnistes soutenaient qu'on ne peut pas prouver une relation, mais seulement la réfuter, ce qui explique pourquoi les analyses statistiques ne tentent pas de prouver une corrélation; au lieu de cela, ils tirent un double négatif et réfutent le fait que les données ne sont pas corrélées, un processus connu sous le nom de rejet de l'hypothèse nulle [source :McLeod].
En gardant ces considérations à l’esprit, les scientifiques doivent concevoir et contrôler soigneusement leurs expériences afin d’éliminer les biais, le raisonnement circulaire, les prophéties auto-réalisatrices et les variables confusionnelles. Ils doivent respecter les exigences et les limites des méthodes utilisées, prélever autant que possible sur des échantillons représentatifs et ne pas surestimer leurs résultats.
Au lieu d’entreprendre la tâche difficile (voire impossible) d’établir la causalité, la plupart des recherches scientifiques se concentrent sur la force des corrélations. Les corrélations peuvent être positives ou négatives, faibles ou fortes. Le coefficient de corrélation statistique, qui varie de -1 à 1, montre la force et la direction de la corrélation.
Si vous tracez des points de données sur un graphique où une variable occupe l'axe X et une autre occupe l'axe Y, les variables sont en corrélation si elles ont une relation linéaire.
Parce que le cerveau humain a tendance à rechercher des relations causales, les scientifiques sont très prudents lorsqu’ils créent des expériences hautement contrôlées – mais ils commettent quand même des erreurs. Voici dix exemples illustrant à quel point il est difficile d'identifier un lien de causalité.
Les gens sont difficiles à rechercher. Ils réagissent non seulement au stimulus étudié, mais aussi à l’expérience elle-même. Les chercheurs tentent aujourd'hui de concevoir des expériences pour contrôler ces facteurs, mais cela n'a pas toujours été le cas.
Prenez les Hawthorne Works à Cicero, dans l’Illinois. Dans une série d'expériences menées entre 1924 et 1932, des chercheurs ont étudié les effets sur la productivité des travailleurs associés à la modification de l'environnement de l'usine de l'Illinois, notamment la modification des niveaux de lumière, le rangement des lieux et le déplacement des postes de travail.
Juste au moment où ils pensaient avoir trouvé quelque chose, ils ont remarqué un problème :les augmentations de productivité observées ont chuté presque aussitôt que les chercheurs ont quitté les travaux, ce qui indique que la connaissance de l'expérience par les travailleurs – et non les changements des chercheurs – avait alimenté le changement. booster. Les chercheurs appellent encore ce phénomène l'effet Hawthorne [source :Obrenović].
Un concept connexe, l'effet John Henry, se produit lorsque les membres d'un groupe témoin tentent de battre le groupe expérimental en intensifiant leurs efforts. Ils n’ont pas besoin d’être au courant de l’expérience; ils n'ont besoin que de voir un groupe recevoir de nouveaux outils ou des instructions supplémentaires. Comme l'homme de légende des conducteurs d'acier, ils veulent prouver leurs capacités et gagner le respect [sources :Saretsky; Vogt].
Les personnages principaux du film de Tom Stoppard "Rosencrantz et Guildenstern sont morts" commencent le film déconcertés et finalement effrayés alors que chacun des 157 tirages consécutifs d'une pièce tombe face. Les explications de Guildenstern sur ce phénomène vont des boucles temporelles à « une justification spectaculaire du principe selon lequel chaque pièce individuelle, lancée individuellement, est aussi susceptible de tomber sur pile que sur face... »
L'évolution a programmé les humains pour voir des modèles, et notre capacité à traiter correctement cette envie semble court-circuiter à mesure que nous passons du temps à jouer. Nous pouvons raisonnablement accepter que les événements indépendants comme les tirages au sort conservent les mêmes chances, quel que soit le nombre de fois que vous les effectuez.
Mais nous considérons également ces événements, de manière moins rationnelle, comme des séquences, établissant de fausses corrélations mentales entre des événements randomisés. Considérant le passé comme un prélude, nous continuons de penser que le prochain retournement de situation devrait être face.
Les statisticiens appellent cela l'erreur du joueur, alias l'erreur de Monte Carlo, d'après un exemple particulièrement illustratif survenu dans cette célèbre station balnéaire de Monaco.
Au cours de l'été 1913, les parieurs regardèrent avec un étonnement croissant la roue de la roulette d'un casino atterrir sur le noir 26 fois de suite. Enflammés par la certitude que le rouge était « dû », les parieurs ont continué à miser leurs jetons. Le casino a fait fortune [sources :Lehrer; Oppenheimer et Monin ; Vogt].
Aucune discussion sur les séquences, la pensée magique ou les fausses causalités ne serait complète sans un feuilletage des pages sportives. Les saisons sportives stellaires résultent d'une interaction si mystérieuse de facteurs – capacités naturelles, entraînement, confiance, facteur X occasionnel – que nous imaginons des modèles de performance, même si les études rejettent à plusieurs reprises les tirs consécutifs et les superstitions « réussies » comme étant autre chose qu'imaginaires. /P>
La croyance aux périodes ou aux récessions implique que le succès « cause » le succès et l’échec « cause » l’échec ou, peut-être plus raisonnablement, que la variation d’un facteur commun, tel que la confiance, est la cause des deux. Mais étude après étude ne parvient pas à le confirmer [source :Gilovich, et al].
Il en va de même pour les superstitions, même si cela n'a jamais empêché le joueur à la retraite de la NBA et gardien des Mavericks de Dallas Jason Terry de dormir dans le short de match des équipes adverses avant chaque match, ou le centre de la LNH et joueur à la retraite des Sénateurs d'Ottawa Bruce Gardiner de tremper son bâton de hockey dans le toilettes pour briser les crises occasionnelles [source :Exact Sports].
La crise des étudiants en deuxième année découle également généralement d’une première année trop bonne. Les variations de performances ont tendance à s'équilibrer à long terme, un phénomène que les statisticiens appellent régression vers la moyenne [source :Barnett, et al]. Dans le sport, cette moyenne est facilitée par l'opposition, qui s'ajuste pour contrer les compétences du nouveau joueur.
Les essais contrôlés randomisés constituent la référence en matière de statistiques, mais parfois — en épidémiologie, par exemple — des considérations éthiques et pratiques obligent les chercheurs à analyser les cas disponibles.
Malheureusement, de telles études observationnelles risquent de comporter des biais, des variables cachées et, pire encore, des groupes d’étude qui pourraient ne pas refléter fidèlement la population. L’étude d’un échantillon représentatif est vitale; cela permet aux chercheurs d'appliquer les résultats à des personnes extérieures à l'étude, comme le reste d'entre nous.
Un exemple concret :le traitement hormonal substitutif (THS) pour les femmes. Au-delà du traitement des symptômes associés à la ménopause, elle était autrefois saluée pour réduire potentiellement le risque de maladie coronarienne (CHD), grâce à une étude observationnelle très médiatisée de 1991 [source :Stampfer et Colditz].
Mais des études contrôlées randomisées ultérieures, y compris la Women's Health Initiative à grande échelle, ont révélé soit une relation négative, soit statistiquement insignifiante, entre le THS et la CHD [source :Lawlor, et al.].
Pourquoi cette différence ? D'une part, les femmes qui utilisent un THS ont tendance à provenir de couches socio-économiques plus élevées et à bénéficier d'un régime alimentaire et d'exercices de meilleure qualité – une relation explicative cachée dont l'étude observationnelle n'a pas pleinement pris en compte [source :Lawlor, et al].
En 1978, le journaliste sportif et chroniqueur Leonard Koppett s'est moqué de la confusion causalité-corrélation en suggérant avec ironie que les résultats du Super Bowl pouvaient prédire le marché boursier. Cela s'est retourné contre lui :non seulement les gens l'ont cru, mais cela a fonctionné – avec une fréquence effrayante.
La proposition, désormais communément connue sous le nom d'indicateur du Super Bowl, était la suivante :si l'une des 16 équipes originales de la Ligue nationale de football – celles qui existaient avant la fusion de la NFL en 1966 avec la Ligue américaine de football – remportait le Super Bowl, le marché boursier augmenter pendant le reste de l’année. Si une ancienne équipe de l'AFL gagnait, elle chuterait [source :Bonsal].
De 1967 à 1978, le système de Koppett est passé à 12 pour 12 ; jusqu'en 1997, son taux de réussite s'est élevé à 95 pour cent. Il a trébuché pendant l’ère Internet (1998-2001) et notamment en 2008, lorsque la Grande Récession a frappé, malgré la victoire des Giants de New York (NFC). Pourtant, en 2022, l'indicateur avait un taux de réussite de 73 % [source :Chen].
Certains ont soutenu que ce modèle existe, motivé par la croyance; cela fonctionne, disent-ils, parce que les investisseurs le croient, ou parce qu'ils croient que d'autres investisseurs le croient.
Cette notion, bien qu'intelligente dans un sens régressif, n'explique guère les 12 années de corrélations réussies précédant l'article de Koppett. D'autres soutiennent qu'un modèle plus pertinent réside dans la tendance haussière à grande échelle du marché boursier, à l'exception de quelques fluctuations majeures et mineures à court terme [source :Johnson].
Le Big Data – le processus de recherche de modèles dans des ensembles de données si volumineux qu'ils résistent aux méthodes d'analyse traditionnelles – fait l'objet d'un grand buzz dans la salle de réunion [source :Arthur ]. Mais est-ce que plus gros est toujours mieux ?
C'est une règle qui est inculquée à la plupart des chercheurs lors de leur premier cours de statistiques :lorsque vous rencontrez une mer de données, résistez à l'envie de partir à la pêche. Avec suffisamment de données, de patience et de latitude méthodologique, les corrélations sont presque inévitables, même si elles sont contraires à l'éthique et largement inutiles.
Après tout, la simple corrélation entre deux variables n’implique pas de lien de causalité; et dans de nombreux cas, cela n'indique pas non plus une grande relation.
D’une part, les chercheurs ne peuvent pas utiliser des mesures statistiques de corrélation bon gré mal gré; chacun contient certaines hypothèses et limites que les expéditions de pêche ignorent trop souvent, sans parler des variables cachées, des problèmes d'échantillonnage et des défauts d'interprétation qui peuvent encombrer une étude mal conçue.
Mais le Big Data est de plus en plus utilisé et salué pour ses contributions inestimables dans des domaines tels que la création de programmes d'apprentissage personnalisés; des appareils portables qui alimentent en temps réel vos dossiers de santé électroniques ; et des services de streaming musical qui vous donnent des recommandations ciblées [source :IntelliPaat]. N'attendez pas trop du Big Data dans le domaine de la causalité.
Toute question liée à l’argent est forcément source de profondes divisions et hautement politisée, et les augmentations du salaire minimum ne font pas exception. Les arguments sont variés et complexes, mais l'un des camps soutient essentiellement qu'un salaire minimum plus élevé nuit aux entreprises, ce qui réduit la disponibilité des emplois, ce qui nuit aux pauvres.
L’autre partie répond qu’il y a peu de preuves à l’appui de cette affirmation et que les 76 millions d’Américains travaillant au salaire minimum ou en dessous, qui, selon certains, ne constituent pas un salaire décent, bénéficieraient d’une telle augmentation. Ils soutiennent que le salaire minimum fédéral pour les employés couverts et non exonérés (7,25 $ de l'heure en septembre 2023) a réduit le pouvoir d'achat des Américains de plus de 20 % [sources :Département du Travail des États-Unis; Cooper, et coll.].
Comme l'aurait plaisanté le critique littéraire George Shaw :« Si tous les économistes étaient mis bout à bout, ils ne parviendraient jamais à une conclusion », et le débat sur le salaire minimum semble le confirmer [source :Quote Investigator]. Pour chaque analyste qui affirme que les augmentations du salaire minimum entraînent des suppressions d'emplois, il y en a un autre qui s'oppose à une telle corrélation.
En fin de compte, les deux parties partagent un problème fondamental :à savoir l’abondance de preuves anecdotiques sur lesquelles bon nombre de leurs têtes parlantes s’appuient pour s’appuyer. Les histoires de seconde main et les données triées sur le volet font du thé faible dans n'importe quelle fête, même lorsqu'elles sont présentées dans de jolis graphiques à barres.
Entre les applications de fitness, les médicaments et les interventions chirurgicales, la perte de poids aux États-Unis représente une industrie de 78 milliards de dollars par an, avec des millions d'Américains qui se mettent à la barre chaque année [source :Research and Markets]. Il n'est pas surprenant que les études sur la perte de poids – bonnes, mauvaises ou laides – fassent l'objet de beaucoup de presse aux États-Unis.
Prenez l’idée populaire selon laquelle prendre un petit-déjeuner bat l’obésité, une pépite glacée au sucre dérivée de deux études principales :l’une, une étude contrôlée randomisée de l’Université Vanderbilt de 1992, a montré qu’inverser les habitudes normales du petit-déjeuner, que ce soit en mangeant ou en ne mangeant pas, était corrélé à la perte de poids; l'autre, une étude observationnelle de 2002 réalisée par le National Weight Control Registry, a corrélé la consommation de petit-déjeuner avec les personnes qui réussissent à perdre du poids – ce qui n'est pas la même chose que de la corréler avec la perte de poids [sources :Brown, et al.; Schlundt et coll.; Wyatt et coll.].
Malheureusement, l’étude du NWCR n’a pas réussi à contrôler d’autres facteurs – ni même à établir un lien de causalité à partir de sa corrélation. Par exemple, une personne qui souhaite perdre du poids peut faire plus d'exercice, prendre un petit-déjeuner ou consommer des protéines de porc entier, mais sans un plan expérimental capable d'établir des liens de causalité, de tels comportements ne sont rien d'autre que des caractéristiques communément concomitantes. :Brown, et al].
Un problème similaire afflige les nombreuses études établissant un lien entre les dîners de famille et une diminution du risque de toxicomanie chez les adolescents. Bien qu'attrayantes pour leur stratégie simple et attrayante, ces études ne parviennent souvent pas à contrôler les facteurs connexes, tels que des liens familiaux solides ou une implication profonde des parents dans la vie d'un enfant [source :Miller, et al].
Nous entendons souvent dire que les hommes, en particulier les jeunes hommes, sont plus susceptibles de se suicider que les femmes. En vérité, de telles déclarations participent d'une généralisation empirique (l'acte de faire une déclaration générale sur un modèle commun sans tenter de l'expliquer) et masquent plusieurs facteurs de confusion connus et potentiels.
Prenons, par exemple, une enquête sur les comportements à risque chez les jeunes de 2021 qui a révélé que les filles de la 9e à la 12e année tentaient de se suicider presque deux fois plus souvent que les élèves de sexe masculin (13 % contre 7 %) [source :American Foundation for Suicide Prevention].
Comment, alors, une corrélation plus élevée peut-elle exister entre le sexe opposé et le suicide ? La réponse réside dans les tentatives de suicide par méthodologie :alors que la méthode de suicide la plus courante pour les deux sexes en 2020 était l'arme à feu (57,9 % pour les hommes et 33,0 % pour les femmes), les femmes étaient presque également susceptibles de mourir par empoisonnement ou par suffocation [source :Institut national de la santé mentale].
Même si nous pouvions éliminer ces facteurs de confusion, il n’en demeure pas moins que la masculinité, en soi, n’est pas une cause. Pour expliquer cette tendance, il faut plutôt identifier des facteurs communs aux hommes, ou du moins suicidaires.
Le même point s’applique aux taux de suicide relativement élevés signalés parmi les hommes divorcés. Le divorce ne pousse pas les hommes à se suicider; cela indique plutôt une relation causale sous-jacente avec des facteurs tels que la rigidité du rôle masculin, leurs réseaux sociaux, l'importance croissante de la garde d'enfants et le désir des hommes de contrôler leurs relations [source :Scourfield et Evans].
Aucune liste de corrélation/causalité ne serait complète sans discuter des préoccupations des parents concernant la sécurité de la vaccination. Avant que la pandémie de COVID-19 ne frappe le monde en 2020, le principal problème était la crainte chez certains parents que la vaccination contre la rougeole, les oreillons et la rubéole soit liée de manière causale aux troubles du spectre autistique. Cette notion a été popularisée par des célébrités comme Jenny McCarthy.
Bien que la communauté médicale ait démystifié l'article d'Andrew Wakefield de 1998 qui a inspiré ce mensonge, et malgré des études ultérieures ne montrant aucun lien de causalité, certains parents continuent de craindre un lien avec l'autisme ou d'autres dangers liés aux vaccins [sources :Park; Sifferlin ; Szabo].
Puis le COVID-19 est arrivé et, à ce jour, a tué des millions de personnes dans le monde. Les scientifiques se sont précipités pour créer un vaccin efficace et ils ont réussi; le premier vaccin américain contre le COVID-19 était disponible en décembre 2020 dans le cadre de l'autorisation d'utilisation d'urgence de la FDA [source :FDA]. Mais cela s’est aussi rapidement lié à l’extrême polarisation de la politique américaine et à la désinformation.
De nombreux parents, en particulier les républicains, craignaient que les vaccins ne soient pas sûrs parce qu'ils avaient été développés si rapidement et parce qu'ils pourraient avoir des effets secondaires à long terme encore inconnus. Il y avait également des craintes erronées quant à l’impact du vaccin sur la fertilité future. Ceux-ci se sont maintenant avérés faux [source :Kelen et Maragakis].
En janvier 2022, seulement 28 % des enfants âgés de 5 à 11 ans avaient reçu au moins une dose de vaccin, ce qui en a déçu beaucoup dans le domaine médical [sources :Hamel, Kates]. Le nombre d’enfants vaccinés augmente; en mai 2023, 40 % des enfants âgés de 5 à 11 ans avaient reçu au moins une dose [source :CDC].
Ce ne sont pas des malentendus inoffensifs. Même si le lien entre l’autisme et les vaccins infantiles a été démystifié, de nombreux parents restent méfiants face aux vaccins. En 2019, il y a eu 1 282 cas de rougeole dans 31 États, le nombre le plus élevé aux États-Unis depuis 1992. La majorité de ces cas concernaient des personnes non vaccinées [source :CDC].
Il convient de se demander si cette correspondance est fortuite, corrélative ou causale. Et les effets de l’hésitation actuelle à la vaccination contre le COVID-19 restent à voir.