On pourrait penser maintenant que nous pourrions dire sans équivoque ce qui cause quoi. Mais la question de la cause, qui a hanté la science et la philosophie depuis leurs premiers jours, nous guette encore pour de nombreuses raisons. Les humains sont évolutivement prédisposés à voir des modèles et psychologiquement enclins à recueillir des informations qui soutiennent des vues préexistantes, un trait connu sous le nom biais de confirmation . Nous confondons coïncidence avec corrélation et corrélation avec causalité.
Pour que A cause B, on a tendance à dire que, au minimum, A doit précéder B, les deux doivent covarier (varier ensemble), et aucune explication concurrente ne peut mieux expliquer la covariance de A et B. Pris isolément, cependant, ces trois exigences ne peuvent pas prouver la cause; elles sont, comme disent les philosophes, nécessaire mais pas suffisant. Dans tous les cas, tout le monde n'est pas d'accord avec eux.
En parlant de philosophes, David Hume a soutenu que la causalité n'existe pas dans un sens prouvable. Karl Popper et les falsificationnistes ont soutenu que nous ne pouvons pas prouver une relation, seulement le réfuter, ce qui explique pourquoi les analyses statistiques ne cherchent pas à prouver une corrélation; au lieu, ils tirent un double négatif et réfutent que les données ne sont pas corrélées, un processus connu sous le nom rejeter l'hypothèse nulle .
Avec de telles considérations à l'esprit, les scientifiques doivent soigneusement concevoir et contrôler leurs expériences pour éliminer les biais, raisonnement circulaire, prophéties auto-réalisatrices et variables cachées. Ils doivent respecter les exigences et les limites des méthodes utilisées, puiser dans des échantillons représentatifs lorsque cela est possible, et ne pas surestimer leurs résultats.
Prêt à lire environ 10 cas où ce n'était pas si facile ?
ContenuLes gens sont une douleur à la recherche. Ils réagissent non seulement au stimulus que vous étudiez, mais aussi à l'expérience elle-même. Les chercheurs essaient aujourd'hui de concevoir des expériences pour contrôler ces facteurs, mais tel n'a pas toujours été le cas.
Prenez les travaux d'Hawthorne à Cicéron, Ill. Dans une série d'expériences de 1924 à 1932, les chercheurs ont étudié les effets sur la productivité des travailleurs associés à la modification de l'environnement de l'usine de l'Illinois, y compris la modification des niveaux d'éclairage, ranger les lieux et déplacer les postes de travail. Juste au moment où ils pensaient qu'ils étaient sur quelque chose, ils ont remarqué un problème :les augmentations de productivité observées ont marqué presque aussitôt que les chercheurs ont quitté les travaux, indiquant que la connaissance de l'expérience par les travailleurs, pas les changements des chercheurs, avait alimenté le coup de pouce. Les chercheurs appellent encore ce phénomène le Effet d'aubépine .
Un concept connexe, les Effet John Henry , se produit lorsque les membres d'un groupe de contrôle tentent de battre le groupe expérimental en donnant un coup de fouet à leurs efforts. Ils n'ont pas besoin de connaître l'expérience; ils n'ont besoin que de voir un groupe recevoir de nouveaux outils ou des instructions supplémentaires. Comme l'homme de légende au volant d'acier, ils veulent prouver leurs capacités et gagner le respect [sources :Saretsky; Vogt].
Les personnages principaux du film de Tom Stoppard "Rosencrantz et Guildenstern sont morts" commencent le film déconcertés, confus et finalement effrayé alors que chacun des 157 lancers consécutifs d'une pièce revient sur face. Les explications de Guildenstern sur ce phénomène vont des boucles temporelles à « une justification spectaculaire du principe selon lequel chaque pièce individuelle, filé individuellement, est aussi susceptible de tomber pile que pile ... "
L'évolution a câblé les humains pour voir des modèles, et notre capacité à traiter correctement cette envie semble court-circuiter plus nous passons de temps à jouer. Nous pouvons rationnellement accepter que des événements indépendants comme les lancers de pièces conservent les mêmes cotes, quel que soit le nombre de fois que vous les exécutez. Mais nous voyons aussi ces événements, moins rationnellement, comme des stries, faire de fausses corrélations mentales entre des événements randomisés. Considérant le passé comme un prélude, nous continuons à penser que le prochain flip devrait être pile.
Les statisticiens appellent cela le l'erreur du joueur , alias le Erreur de Monte-Carlo , après un exemple particulièrement illustratif se produisant dans cette célèbre station balnéaire de Monaco. Au cours de l'été 1913, les parieurs regardaient avec une stupéfaction croissante la roue de la roulette d'un casino atterrir sur le noir 26 fois de suite. Enflammé par la certitude que le rouge était « dû, " les parieurs n'arrêtaient pas de déposer leurs jetons. Le casino a fait une menthe [sources :Lehrer; Oppenheimer et Monin; Vogt].
Pas de discussion sur les stries, la pensée magique ou la fausse causalité seraient complètes sans feuilleter les pages sportives. Les saisons sportives stellaires résultent d'une interaction si mystérieuse de facteurs - capacité naturelle, entraînement, confiance, le facteur X occasionnel - que nous imaginons des modèles de performance, même si les études rejettent à plusieurs reprises les tirs consécutifs et les superstitions « réussies » comme autre chose qu'imaginaires.
La croyance en des stries ou des effondrements implique que le succès "cause" le succès et l'échec "cause" l'échec ou, peut-être plus raisonnablement, cette variation d'un facteur commun, comme la confiance, provoque les deux. Mais étude après étude ne parvient pas à le prouver [sources :Gilovich et al.; Tversky et Gilovich]. Il en va de même pour les superstitions, bien que cela n'ait pas empêché Kevin Rhomberg des Indians de Cleveland de refuser de tourner à droite sur le terrain, ou empêcher le centre des Sénateurs d'Ottawa Bruce Gardiner de tremper son bâton de hockey dans les toilettes pour briser la crise occasionnelle [source :Trex].
La crise de deuxième année, trop, résulte généralement d'une trop bonne première année. Les oscillations de performance ont tendance à s'égaliser à long terme, un phénomène que les statisticiens appellent régression vers la moyenne . Dans les sports, cette moyenne est aidée par l'opposition, qui s'ajuste pour contrer les compétences réussies du nouveau joueur.
Les essais contrôlés randomisés sont l'étalon-or en statistiques, mais parfois - en épidémiologie, par exemple, des considérations éthiques et pratiques obligent les chercheurs à analyser les cas disponibles. Malheureusement, tel études d'observation biais de risque, variables cachées et, le pire de tout, un groupe d'étude qui pourrait ne pas refléter la population dans son ensemble. L'étude d'un échantillon représentatif est vitale; il permet aux chercheurs d'appliquer les résultats à des personnes extérieures à l'étude, Comme le reste d'entre nous.
Un exemple concret :l'hormonothérapie substitutive (THS). Au-delà du traitement des symptômes associés à la ménopause, il était autrefois salué pour avoir potentiellement réduit le risque de maladie coronarienne (CHD), grâce à une étude observationnelle très médiatisée de 1991 [source :Stampfer et Colditz]. Mais plus tard, des études contrôlées randomisées, y compris l'Initiative à grande échelle pour la santé des femmes, a révélé soit une relation négative, ou statistiquement non significatif, entre THS et CHD [sources :Lawlor et al.; New York Times].
Pourquoi la différence ? Pour une chose, les femmes qui utilisent un THS ont tendance à provenir de couches socio-économiques plus élevées et reçoivent une meilleure qualité de régime alimentaire et d'exercice - une relation explicative cachée dont l'étude d'observation n'a pas pleinement pris en compte [source :Lawlor et al.].
En 1978, Le journaliste sportif et chroniqueur Leonard Koppett s'est moqué de la confusion causalité-corrélation en suggérant avec ironie que les résultats du Super Bowl pourraient prédire le marché boursier. Cela s'est retourné contre lui :non seulement les gens l'ont cru, mais cela a fonctionné - avec une fréquence effrayante.
La proposition était la suivante :si l'une des 16 équipes originales de la Ligue nationale de football - celles qui existaient avant la fusion de la NFL en 1966 avec la Ligue américaine de football - remportait le Super Bowl, le marché boursier clôturerait plus haut l'année suivante que le 31 décembre précédent. Si une ancienne équipe de l'AFL gagnait, il baisserait [sources :Koppett; Koppett ; Koppett ; Koppett ; Zweig].
De 1967 à 1978, Le système de Koppett est allé 12 pour 12; jusqu'en 1997, il affichait un taux de réussite de 95 pour cent. Il a trébuché en 1998 et 1999, quand AFL aluns les Denver Broncos ont gagné et le marché a monté [sources :Koppett; Koppett ; Koppett ; Koppett].
Certains ont soutenu que le modèle existe, motivé par la croyance; Ça marche, ils disent, parce que les investisseurs pensent que oui, ou parce qu'ils croient que d'autres investisseurs le croient. Cette notion, bien qu'intelligent d'une manière régressive, explique à peine les 12 années de corrélations réussies qui ont précédé l'article de Koppett. D'autres soutiennent qu'une tendance plus pertinente réside dans la tendance à la hausse à grande échelle du marché boursier, sauf fluctuations majeures et mineures à court terme, et le fait qu'une équipe originale de la NFL a remporté chaque Super Bowl de 1984 à 1998 [source :Norris].
Les mégadonnées - le processus de recherche de modèles dans des ensembles de données si volumineux qu'ils résistent aux méthodes d'analyse traditionnelles - font actuellement l'objet d'un grand buzz dans la salle de réunion [source :Arthur]. Mais est-ce que plus gros est toujours mieux ?
C'est une règle qui revient à la plupart des chercheurs dans leur première classe de statistiques :lorsqu'ils rencontrent une mer de données, résister à l'envie d'aller sur un Expédition de pêche . Avec suffisamment de données, patience et marge de manœuvre méthodologique, les corrélations sont presque inévitables, si contraire à l'éthique et largement inutile.
Après tout, la simple corrélation entre deux variables n'implique pas de causalité; non plus, dans de nombreux cas, pointent vers une grande partie d'une relation. Pour une chose, les chercheurs ne peuvent pas utiliser des mesures statistiques de corrélation bon gré mal gré; chacun contient certaines hypothèses et limites que les expéditions de pêche ignorent trop souvent, pour ne rien dire des variables cachées, des problèmes d'échantillonnage et des défauts d'interprétation qui peuvent gâcher une étude mal conçue.
Accordé, le big data a son utilité. Le contrôle des stocks se nourrit de la découverte des modèles d'achat, aussi mystérieuses que soient leurs causes sous-jacentes. Pour prendre un exemple un peu effrayant, Target a utilisé des modèles d'achat pour identifier les clientes enceintes, puis leur envoyer des coupons ciblés [sources :Duhigg ; Colline; Taylor]. Alors profitez de cette carte de récompenses - et de 10 % de réduction sur vos vitamines prénatales - mais n'attendez pas trop des mégadonnées du département de causalité.
Toute question relative à l'argent est forcément profondément conflictuelle et hautement politisée, et les augmentations du salaire minimum ne font pas exception. Les arguments sont variés et complexes, mais essentiellement un côté soutient qu'un salaire minimum plus élevé nuit aux entreprises, qui réduit la disponibilité des emplois, qui blesse les pauvres. L'autre partie répond qu'il y a peu de preuves pour cette affirmation, et que les 3,6 millions d'Américains travaillant au salaire minimum ou en dessous, dont certains prétendent qu'il ne s'agit pas d'un salaire vital, bénéficieraient d'une telle augmentation. Ils soutiennent que, corrigé de l'inflation, le salaire minimum fédéral (7,25 $ de l'heure en décembre 2013) a baissé en luge au cours des 40 dernières années [sources :Bureau of Labor Statistics; Irwin].
Comme George Bernard Shaw aurait plaisanté, « Si tous les économistes étaient mis bout à bout, ils n'arriveraient jamais à une conclusion, " et le débat sur le salaire minimum semble le confirmer [source :Ridgers. Pour chaque analyste qui dit que les augmentations du salaire minimum font disparaître les emplois, il y en a un autre qui s'oppose à une telle corrélation [sources :Baskaya et Rubinstein; Card et Krueger].
À la fin, les deux parties partagent un problème fondamental, à savoir, l'abondance de preuves anecdotiques sur lesquelles beaucoup de leurs têtes parlantes s'appuient pour se soutenir. Les histoires de seconde main et les données triées sur le volet rendent le thé faible dans n'importe quelle fête, même lorsqu'ils sont présentés dans de jolis graphiques à barres.
Entre les livres, médicaments et chirurgies, la perte de poids aux États-Unis est une industrie de 20 milliards de dollars par an, avec 108 millions d'Américains qui grimpent chaque année jusqu'à la barre de perte de poids [source :ABC News]. Sans surprise, études de perte de poids - bien, mauvais ou laid - obtenez beaucoup de presse aux États-Unis
Prenez l'idée populaire que le petit-déjeuner bat l'obésité, une pépite glacée au sucre issue de deux études principales :une étude contrôlée randomisée de l'Université Vanderbilt de 1992, a montré que l'inversion des habitudes de petit-déjeuner normales, que ce soit en mangeant ou en ne mangeant pas, corrélée avec la perte de poids; L'autre, une étude observationnelle de 2002 du National Weight Control Registry, corréler le petit-déjeuner avec la perte de poids réussie -- ce qui n'est pas la même chose que la corréler avec la perte de poids [sources :Brown et al. ; O'Connor; Schlundt et al.; Wyatt et al.].
Malheureusement, l'étude NWCR n'a pas réussi à contrôler d'autres facteurs - ou, En effet, établir un lien de causalité à partir de sa corrélation. Par exemple, une personne qui veut perdre du poids pourrait faire plus d'exercice, ou prendre le petit déjeuner, ou optez pour des protéines de porc entier, mais sans un dispositif expérimental capable d'établir des liens de causalité, de tels comportements ne sont rien de plus que des caractéristiques co-occurrentes [sources :Brown et al.; O'Connor].
Un problème similaire afflige les nombreuses études établissant un lien entre les dîners en famille et une diminution du risque de toxicomanie chez les adolescents. Bien qu'attrayant pour leur simplicité, stratégie attrayante, ces études ne parviennent souvent pas à contrôler les facteurs connexes, comme des liens familiaux solides ou une profonde implication parentale dans la vie d'un enfant [source :Bialik].
On entend souvent dire que les hommes, surtout les jeunes hommes, sont plus susceptibles de se suicider que les femmes. En vérité, de telles déclarations font partie de généralisation empirique -- l'acte de faire une déclaration générale sur un modèle commun sans essayer de l'expliquer -- et masquer un certain nombre de facteurs de confusion connus et potentiels.
Prendre, par exemple, le fait que les femmes font trois fois plus de tentatives de suicide que les hommes. Comment alors une corrélation plus élevée peut-elle exister entre le sexe opposé et le suicide ? La réponse réside dans le taux de réussite, influencé par les différences de méthodologie :les femmes ont recours à la pilule, tandis que les hommes ont tendance à privilégier les armes à feu [source :O'Connell].
Même si nous pouvions éliminer de tels facteurs de confusion, le fait resterait que la masculinité, en soi, n'est pas une cause. Pour expliquer la tendance, nous devons plutôt identifier les facteurs communs aux hommes, ou au moins suicidaires. Le même point s'applique aux taux comparativement élevés de suicide signalés chez les hommes divorcés. Le divorce ne pousse pas les hommes à se suicider; si quoi que ce soit, la variable causale se cache parmi les facteurs connexes, comme l'isolement, dépression, un sentiment d'impuissance, stress financier ou perte de garde [sources :Kposowa; Kposowa ; Reuters].
Aucune liste de corrélation/causalité ne serait complète sans discuter des préoccupations des parents concernant la sécurité de la vaccination, enraciné dans l'idée, popularisé par des célébrités comme Jenny McCarthy, que la rougeole, Les vaccinations contre les oreillons et la rubéole (ROR) sont causalement liées aux troubles du spectre autistique. Bien que la communauté médicale ait démystifié l'article d'Andrew Wakefield de 1998 qui a inspiré l'idée, et malgré des études ultérieures ne montrant aucun lien de causalité, même avec plusieurs vaccinations, certains parents craignent toujours un lien avec l'autisme ou d'autres dangers liés à la vaccination [sources :The Lancet; Se garer; Sifferlin; Szabo].
S'il est vrai qu'aucun vaccin n'est à 100 pour cent inoffensif, la croyance en ce lien de causalité découle principalement d'une préoccupation parentale naturelle, accablé de confusion, alimenté par des preuves anecdotiques et influencé par biais de confirmation , ou "si je ne l'avais pas cru, je ne l'aurais pas vu". Le fait que les parents et les médecins ont tendance à reconnaître tardivement les symptômes de l'autisme alimente encore la confusion, autour de l'âge où les enfants reçoivent de nombreux vaccins. En réalité, l'apparition de l'autisme est assez complexe et suit plus d'un modèle. En effet, des études montrent maintenant que l'apparition peut commencer dès 6 à 12 mois [sources :CDC; Johnson et Schultz; Mandell et al.; NIH; Ozonoff et al.].
Ce n'est pas un malentendu anodin. En 2011, Le magazine Time a rapporté que 13 pour cent des parents sautaient, retardé ou fractionné les vaccinations de leurs enfants; dans certaines zones rurales, ce nombre a grimpé entre 20 et 50 pour cent. Pendant ce temps, 15 ans après le début de cette panique, les centres médicaux ont signalé des épidémies de coqueluche et de rougeole. Que cette correspondance soit fortuite, corrélatif ou causal mérite d'être considéré [sources :O'Connor; Se garer; Se garer].
Publié à l'origine :23 décembre 2013
Autant j'ai horreur de la mauvaise conception expérimentale, confiance aveugle dans les statistiques et les reportages scientifiques sensationnalistes, il convient de mentionner que de fortes corrélations, bien qu'il ne suffise pas à lui seul à prouver la cause, indiquent souvent des domaines qui méritent d'être étudiés. Clairement, par "corrélations", je ne veux pas dire autocorrélations, des variables confusionnelles ou d'autres artefacts de mauvaise conception ou des exigences et contraintes méthodologiques mal comprises ; néanmoins, peut-être qu'Internet peut écarter un peu le slogan "la corrélation n'implique pas la causalité", ou au moins devenir un peu plus sélectif dans son application.