Crédit :CC0 Domaine public
L'ère du big data est arrivée :le monde a créé plus de données au cours des deux dernières années que dans toute l'histoire précédente de la race humaine. Les chercheurs de l'USC Leonard Davis School of Gerontology disséquent des trésors d'informations - provenant de sources aussi diverses que les scintigraphies cérébrales et le génome humain - pour alimenter des recherches révolutionnaires sur l'amélioration de la façon dont nous vieillissons, et de remodeler l'enseignement de la gérontologie pour permettre aux futurs scientifiques d'avoir un impact dans un domaine en évolution.
La gérontologie est prête à utiliser les outils les plus récents, en partie parce que le domaine a toujours impliqué de grands ensembles de données, dit Mireille Jacobson, un microéconomiste et professeur agrégé de gérontologie à l'USC Leonard Davis School. Par exemple, son travail s'est appuyé sur de vastes ensembles de données sur la population et, d'une certaine manière, ça n'a pas changé, elle dit. "C'est surtout que de plus en plus de données sont disponibles."
Jacobson travaille avec des données de Medicare et d'autres bases de données accessibles au public pour comprendre comment l'assurance maladie affecte le bien-être des personnes âgées. Par exemple, une analyse des données de Medicare a révélé que les prestations de Medicare peuvent aider à réduire le stress financier chez les personnes de plus de 65 ans. Elle étudie également les prestataires de soins de santé et la manière dont ils prennent des décisions en matière de soins en réponse à divers facteurs extérieurs, y compris les nouvelles recommandations de dépistage et les pénuries de médicaments.
« L'effort de numérisation et de mise à disposition électronique de tout est une nouveauté, " Elle ajoute.
Jacobson fait partie d'un groupe de chercheurs en gérontologie de l'USC Leonard Davis School qui plonge dans de vastes ensembles de données afin de mieux comprendre le vieillissement et la durée de vie. Leur travail a des implications importantes pour la formation des étudiants et pour la création de meilleurs ensembles de données, qui peuvent aider les chercheurs à mieux comprendre les facteurs de risque individuels, identifier le rôle des gènes dans la maladie et développer des interventions plus précises.
Traverser les disciplines
Em Arpawong, professeur assistant de recherche en gérontologie et directeur du Noyau de bioinformatique de gérontologie, cherche à rassembler diverses informations pour mieux comprendre comment les composants génétiques et environnementaux interagissent pour entraîner différents résultats de santé chez les personnes âgées. Ses travaux actuels intègrent l'utilisation d'approches de modélisation à l'échelle du génome et de jumeaux et de familles à partir de grands ensembles de données représentant des centaines de milliers d'individus sur plusieurs décennies, tels que l'étude américaine sur la santé et la retraite et l'étude Project Talent Aging, qui s'étendent tous deux sur des décennies de suivi avec des dizaines de milliers de participants.
Arpawong dit que l'étude du vieillissement est unique dans le domaine de la recherche en santé, car il y a tellement de choses qui se produisent tôt dans la vie qui ont un impact sur la trajectoire d'une personne plus tard.
"J'adopte une approche développementale de la durée de vie pour étudier les effets des conditions de vie antérieures sur la santé des personnes âgées, y compris la génétique, les comportements et les facteurs contextuels tels que le statut socio-économique et l'adversité familiale, " elle dit, « et cela nécessite de rassembler de nombreuses données. »
Travailler sur des projets comme la création d'un indice de fragilité, développer une analyse pangénomique de la symptomatologie dépressive chez les personnes âgées, calculer comment les facteurs génétiques et environnementaux contribuent aux changements cognitifs liés au vieillissement et évaluer la stabilité des marqueurs IRM de la démence nécessite de nombreuses compétences dans différents domaines et la collaboration. Il y a une couche supplémentaire de complexité lorsque les chercheurs doivent traduire les résultats des études animales sur les marqueurs génétiques aux humains.
"L'objectif de mon travail avec le noyau de bioinformatique est la traduction, ou collaborer avec des personnes sur la traduction, de leurs découvertes à partir de systèmes modèles tels que des souris dans des données de population humaine, " dit Arpawong.
C'est un peu un processus circulaire :souvent, les chercheurs utilisent des données humaines pour examiner l'impact des résultats des systèmes de modèles animaux. Une fois qu'ils trouvent certaines choses dans les données humaines, ils reviennent et effectuent ces expériences sur des modèles animaux pour voir s'il existe des mécanismes de causalité. Cette exploration axée sur les données ouvre de nombreuses nouvelles façons de comprendre le vieillissement, parce qu'il n'est pas possible de faire ce type d'études de gérontologie translationnelle et intégrative uniquement chez l'homme, étant donné nos longues durées de vie et nos environnements de vie très différents.
"[Cette traduction] est devenue une partie plus importante du travail ici en gérontologie qui a été fascinant et contribue à accélérer le rythme des résultats de la recherche dans des disciplines qui ont traditionnellement fonctionné de manière plus indépendante, " dit Arpawong.
Le travail est devenu naturellement collaboratif, impliquant de nombreux enquêteurs différents avec des antécédents divers.
"Il y a beaucoup de croisements dans différents départements et de multiples avantages à travailler avec des gens du Dornsife College, Keck School of Medicine et l'Institut des sciences de l'information, y compris de la psychologie à la biologie computationnelle, " explique Arpawong. " C'est vraiment une toile enchevêtrée partout dans l'USC. Cela ne fait que souligner toute la nature transdisciplinaire de ce travail. Vous devez parler et travailler avec beaucoup de gens pour vous assurer que vous avancez dans la bonne direction."
Arpawong a récemment utilisé divers ensembles de données pour trouver le lien entre la génétique et la mémoire verbale. Elle a découvert qu'un marqueur génétique de la maladie d'Alzheimer n'était pas le seul :il existe un deuxième gène qui joue spécifiquement un rôle dans les effets sur la capacité de mémoire liée au vieillissement.
Les mégadonnées ont également changé la façon dont les gens collaborent, dit Eileen Crimmins, Professeur d'université USC et professeur de gérontologie AARP. Aucun chercheur ne peut connaître à lui seul toutes les parties d'un projet, elle explique.
"Il y a beaucoup plus de grands groupes multidisciplinaires où tout le monde a une spécialisation et personne ne sait tout, " dit-elle. " Il y a donc beaucoup plus de gens qui font confiance qu'ils le savent et qu'ils peuvent le faire correctement. "
Toutes ces données nécessitent de nouvelles solutions pour les héberger et les transférer, en particulier lorsque vous travaillez avec différents chercheurs du monde entier.
"L'échelle est beaucoup plus grande dans ce que nous devons traiter et [dans] la fréquence et la nécessité de transférer ces choses, maintenir la sécurité des données, puis disposer des outils pour le faire, " dit Arpawong. " Une grande partie de l'analyse des données que nous devons effectuer nécessite un codage dans différents langages de programmation pour lesquels certains des logiciels statistiques les plus courants n'ont pas la capacité, et héberger les données d'une manière qui va au-delà de son propre disque dur."
L'éducation doit également correspondre aux derniers développements de la science des mégadonnées, exiger que les étudiants maîtrisent le codage, axé sur les données et capable de poser de nouvelles questions sur la science du vieillissement. Les mégadonnées ont changé la donne pour les étudiants diplômés, dit Crimmins, qui dirige le programme de formation à la recherche multidisciplinaire en gérontologie à l'USC Leonard Davis School. Le programme aide les étudiants prédoctoraux et postdoctoraux à se familiariser avec l'étude du vieillissement dans plusieurs disciplines.
"Il y a beaucoup plus d'activité multidisciplinaire parce que les questions ont vraiment bougé, ", explique Crimmins.
Les étudiants d'aujourd'hui acquièrent constamment de nouvelles compétences et connaissances, de la pathologie de la pollution atmosphérique à la génétique, en plus de leurs études fondamentales en gérontologie. Une grande partie de ce que les gens font, c'est d'apprendre sur le tas pour acquérir des compétences qui ne sont pas enseignées en classe, Arpawong ajoute.
Pour les étudiants entrant dans le domaine, comprendre les statistiques et avoir une solide compréhension de la numératie est crucial. Dans sa classe, Jacobson présente des « données étranges », par exemple, pourquoi la moyenne d'un ensemble de données peut être bien supérieure à la médiane.
« Si vous pensez au revenu moyen aux États-Unis par opposition au revenu médian, cela pourrait nous dire quelque chose sur les Américains en général, " dit-elle. " Dans un certain sens, les mégadonnées disponibles devraient nous obliger à revenir à l'essentiel et à en voir les fondements."
La compétence en codage est également au cœur des outils que les nouveaux chercheurs utilisent dans le domaine, et cela nécessite parfois un codage dans plusieurs langues.
S'adapter à l'avenir
La disponibilité et les types de données ne feront qu'augmenter à l'avenir, et les chercheurs réfléchissent à la manière d'ajuster leurs études pour faire place à de nouvelles informations. Crimmins est co-chercheur pour l'étude sur la santé et la retraite, qui dure depuis environ 30 ans. L'étude est réalisée tous les deux ans, moitié en personne et moitié au téléphone. Depuis 2006, les chercheurs ont collecté des biomarqueurs auprès des personnes qu'ils visitent en personne - des mesures telles que le poids et la taille, tension artérielle et un échantillon de sang.
Ces mesures permettront aux chercheurs de faire des associations plus importantes dans les données existantes, et elles éclipsent également les autres données de l'analyse. "Deux millions de marqueurs pour chaque personne, et nous en avons 20, 000 personnes dans l'étude, ", dit Crimmins. "Cela nécessite vraiment une informatique de grande capacité."
À l'aide des données de l'Étude sur la santé et la retraite, Crimmins a fait plusieurs découvertes surprenantes. La première est que les gens ont en fait plus d'années de bonne santé cérébrale après l'âge de 65 ans que ce n'était le cas dans le passé. Une autre étude des données a révélé que l'éducation donne aux gens un avantage dans leurs dernières années, les aidant à garder la démence à distance et leurs souvenirs intacts. La collecte de biomarqueurs auprès des participants à l'étude a également permis à l'ancienne élève de l'USC Leonard Davis Morgan Levine '08, doctorat '15 et Crimmins pour développer une méthode prometteuse de mesure biologique, par opposition à chronologique, âge. Leurs travaux ont abouti à des découvertes montrant que les Américains vieillissent peut-être plus lentement qu'ils ne l'étaient il y a deux décennies.
L'USC est devenue une université productrice de données. Un gros travail est fait pour favoriser l'utilisation des données en les rendant disponibles et dans un format exploitable, dit Crimmins. Cela représente une grande partie de ce qu'elle fait :rendre service au plus grand domaine.
"C'est un peu attendu dans notre domaine pour ceux d'entre nous qui sont producteurs de données, ce qui est très important ici à l'USC car nous produisons de nombreux ensembles de données internationaux, " elle dit.
Le big data fait tomber les frontières traditionnelles entre les domaines, dit Arpawong. Les résultats les plus forts proviendront probablement d'un méli-mélo de différents types de données, par exemple, facturation médicale et imagerie, ou des données génomiques et environnementales.
"Vous devez le décomposer en morceaux. Vous avez besoin de personnes qui savent comment manipuler les données pour obtenir ce que vous voulez - et c'est très nuancé pour chaque morceau, " dit-elle. " Vous pouvez obtenir des résultats de n'importe quelle manière, vous pouvez coder quelque chose, mais est-ce correct ? Et un gros problème pour la bioinformatique est de s'assurer que les gens sont formés à ces types de ressources de données pour s'assurer qu'ils font ce qu'ils visent à faire. »
Le doyen Pinchas Cohen de l'école USC Leonard Davis convient que dans l'environnement de recherche moderne d'aujourd'hui, l'exploitation de données provenant de diverses sources est aussi importante que la compréhension des fonctions cellulaires. Dans son propre laboratoire, il dirige des études axées sur les mégadonnées pour identifier des gènes mitochondriaux jusque-là inconnus, travailler pour comprendre leurs fonctions et s'ils peuvent être des cibles pour les traitements de la maladie d'Alzheimer, diabète et autres maladies.
"Au lieu d'un état d'esprit unique, l'ère des mégadonnées nous permet d'avoir une approche du 21e siècle pour lutter contre le risque de maladie et promouvoir un vieillissement en bonne santé avec une compréhension approfondie des facteurs de risque d'un individu, " dit Cohen. " La science ne consiste plus à regarder dans un microscope dans son propre laboratoire; il s'agit de regarder vers l'extérieur les données de millions de personnes à travers le monde."