Le pouvoir surprenant des petites données :plus d'informations ne sont pas nécessairement meilleures dans les soins de santé ou les entreprises

science >> Science > >> Autres

Crédit :CC0 Domaine public

Les maladies chroniques comme les maladies cardiaques et le diabète sont en augmentation depuis des décennies. Ils sont la première cause de décès et d'invalidité aux États-Unis aujourd'hui et l'une des raisons pour lesquelles les coûts des soins de santé sont incontrôlables.

Il est donc logique d'identifier les personnes à risque de maladies chroniques avant qu'elles ne tombent malades. Tout au moins, une intervention précoce peut souvent ralentir le rythme de la maladie et améliorer la qualité de vie des patients et, ce faisant, potentiellement économiser des milliards de dollars en frais médicaux.

C'est pourquoi de nombreux employeurs—environ 50 %, selon un rapport de RAND—parrainer des programmes de bien-être incitatifs pour leurs travailleurs. En plus des remises sur les gymnases, ces programmes incluent généralement une évaluation des risques pour la santé sous la forme de tests de laboratoire utilisés pour calculer les facteurs de risque de chaque personne pour les maladies courantes. Les personnes à risque se voient ensuite offrir des soins préventifs et une surveillance supplémentaires.

Malheureusement, les bénéfices attendus ne se matérialisent pas toujours, dit Mohsen Bayati, professeur agrégé d'opérations, informations, et la technologie à la Stanford Graduate School of Business. Plusieurs études ont montré que de tels programmes peuvent finir par coûter plus d'argent qu'ils n'en économisent. Une raison probable, il dit, est que les évaluations des risques elles-mêmes ne sont pas si précises que ça.

« Si vous identifiez à tort quelqu'un comme étant à haut risque, ce qu'on appelle un « faux positif », vous payez pour des services inutiles, ", dit Bayati. "Et si vous manquez quelqu'un qui est vraiment à risque - un faux négatif - alors vous serez toujours confronté à ces énormes factures médicales à l'avenir."

Une solution, il dit, serait d'exécuter un panel de tests plus élaboré. Mais cela augmenterait également les coûts. "Les tests en laboratoire coûtent cher. Les entreprises le font pour beaucoup d'employés, ils examinent donc un ensemble assez restreint de biomarqueurs standard. Et puis la capacité de détection n'est pas très forte."

Au lieu, Bayati dit, la clé pour faire fonctionner ces programmes de prévention est d'améliorer la sélection des biomarqueurs. Mais comment fais-tu cela? Pour le dire plus rigoureusement :comment choisissez-vous un ensemble minimal de marqueurs qui maximisera la puissance diagnostique sur une gamme de maladies ?

C'est le casse-tête que Bayati a abordé dans un article récent, qu'il a coécrit avec deux collègues de Stanford :Sonia Bhaskar, Doctorat., un ancien assistant de recherche de Stanford qui travaille maintenant comme data scientist chez Netflix, et Andrea Montanari, professeur de statistiques et de génie électrique. En utilisant un jujitsu technique du domaine de l'apprentissage automatique, ils ont développé une méthode qui peut être utilisée pour n'importe quel groupe de maladies cibles ou niveau de budget programme.

Lorsqu'ils l'ont testé sur les dossiers médicaux de quelque 75 personnes, 000 malades, ils ont découvert qu'il pouvait prédire un groupe de neuf maladies graves avec une précision inattendue. "Nous étions surpris, " dit Bayati. Par rapport à une évaluation hypothétique de Cadillac-care sans limite sur le nombre de biomarqueurs, le leur coûterait bien moins cher, pourtant ont presque le même niveau de pouvoir prédictif.

Et peut-être qu'il y a une leçon générale ici, à l'ère du Big Data. "Il faut se demander, " Bayati réfléchit. " Dans tous les secteurs, les entreprises investissent des ressources pour collecter de plus en plus de données. Nous mettons des capteurs sur tout, juste parce que nous pouvons, et franchement, tout n'est pas nécessaire ou utile."

Trop d'informations

Traditionnellement, Les évaluations des risques pour la santé ont été conçues en identifiant les meilleurs marqueurs pour chaque maladie isolément et en les ajoutant à une liste. « Les hôpitaux sont de plus en plus sophistiqués dans la façon dont ils identifient les biomarqueurs, avec des statistiques avancées et maintenant de l'IA, " Bayati dit. "Mais tout est fait une maladie à la fois."

Vous pourriez potentiellement créer un panel de test efficace de cette façon, il dit, mais cela nécessiterait beaucoup trop de biomarqueurs. Donc en pratique, des compromis sont faits et la précision diminue. Au lieu, Bayati et ses collègues ont ajouté une deuxième étape à l'analyse :« Nous avons dit, Commençons par cette liste complète et voyons ensuite si nous pouvons la simplifier d'une meilleure manière pour minimiser la perte de puissance de diagnostic. »

Pour faire ça, ils se sont inspirés de certaines techniques de statistiques de grande dimension utilisées dans l'apprentissage automatique. « La question fondamentale est, si vous avez trop d'informations, comment pouvez-vous le réduire au plus petit ensemble d'informations le plus utile ? Comment réduisez-vous les dimensions de l'ensemble de données ?"

Les mathématiques sont impliquées, mais au fond, la clé pour résoudre ce problème « TMI » est d'optimiser conjointement la sélection de biomarqueurs. Au lieu de trouver les meilleurs pour chaque maladie séparément, décidez d'abord du nombre de biomarqueurs que vous voulez (les chercheurs en ont retenu 30), puis maximisez le pouvoir prédictif, sur toutes les combinaisons possibles, pour l'ensemble des maladies à la fois.

Le modèle fonctionne parce que de nombreux biomarqueurs signalent plus d'une maladie. Glycémie élevée, par exemple, peut être un signe de diabète, mais aussi une maladie rénale, maladie du foie, ou une maladie cardiaque. Des taux anormaux de phosphatase alcaline sont associés à des maladies cardiaques, maladie du foie, et cancéreux. « Si votre processus de sélection ne tient pas compte de ces chevauchements, vous jetez des informations, " dit Bayati.

Aucune limite aux objectifs

La puissance de la méthode décrite par Bayati et ses collègues est qu'elle peut être utilisée pour poursuivre plusieurs objectifs à la fois. Qu'est-ce qui est le plus important dans les évaluations des risques pour la santé :l'exactitude ou le coût ? Les deux, bien sûr. Voulons-nous prédire la maladie d'Alzheimer ou la maladie artérielle ? Oui.

"Il n'y a pas de limite au nombre de buts, " Bayati dit. " Vous pourriez en lister 20, 30, 100 objectifs sur lesquels vous souhaitez optimiser. Et puis vous pouvez affiner les informations que vous devez collecter, car à un moment donné, l'ajout d'objectifs ne nécessite pas de données supplémentaires."

Si cela aide à tenir la promesse des programmes de bien-être en entreprise, c'est un gros problème pour les soins de santé. Mais cette approche peut également être utilisée pour améliorer une gamme d'opérations commerciales et de politique publique. Ce qui est crucial, Bayati dit, est d'être clair sur les objectifs. Les ordinateurs peuvent faire l'analyse, mais les humains doivent leur dire quoi optimiser.

Et c'est un pas, il pense, les entreprises passent trop souvent sous silence. "Parfois, il semble que les entreprises se précipitent pour accumuler des données et poser des questions plus tard. Mais plus d'informations n'est pas nécessairement meilleure. Ce qui compte, c'est de savoir quoi regarder. Notre document est un pas dans cette direction."

Une étude unique en son genre révèle que la perte des médias locaux aggrave la polarisation politique

Qualité de la littérature liée à la maîtrise des langues étrangères chez les jeunes

Autres