Les chercheurs doivent se déplacer pour visiter en personne les spécimens non numérisés, ne sachant pas ce qu'ils vont trouver - s'ils sont même conscients de leur existence. Crédit :Smithsonian Institution, CC BY-NC-SA
Les grands musées du monde recèlent un secret :ils abritent des millions et des millions de spécimens d'histoire naturelle qui ne voient presque jamais la lumière du jour. Ils sont cachés à la vue du public, généralement logé derrière ou au-dessus des salles d'exposition publiques, ou dans des bâtiments hors site.
Ce qui est exposé au public ne représente qu'une infime fraction de la richesse des connaissances sous la direction de chaque musée. Au-delà des fossiles, les musées sont les dépositaires de ce que nous savons des espèces vivantes du monde, ainsi qu'une grande partie de notre propre histoire culturelle.
Pour les paléontologues, biologistes et anthropologues, les musées sont comme les archives des historiens. Et comme la plupart des archives – pensez à celles conservées au Vatican ou à la Bibliothèque du Congrès – chaque musée détient généralement de nombreux spécimens uniques, les seules données dont nous disposons sur les espèces qu'ils représentent.
Le caractère unique de chaque collection de musée signifie que les scientifiques effectuent régulièrement des pèlerinages dans le monde entier pour les visiter. Cela signifie également que la perte d'une collection, comme lors du récent incendie déchirant de Rio de Janeiro, représente une perte de connaissances irremplaçable. C'est semblable à la perte des antécédents familiaux lorsqu'un aîné de la famille décède. A Rio, ces pertes comprenaient des dinosaures uniques en leur genre, peut-être les restes humains les plus anciens jamais trouvés en Amérique du Sud, et les seuls enregistrements audio et documents de langues autochtones, y compris beaucoup qui n'ont plus de locuteurs natifs. Des choses que nous savions autrefois, nous ne savons plus; les choses que nous aurions pu savoir ne peuvent plus être connues.
Mais maintenant, les technologies numériques - y compris Internet, bases de données interopérables et techniques d'imagerie rapide – permettent d'agréger électroniquement les données des musées. Des chercheurs, dont une équipe multi-institutionnelle que je dirige, posent les bases d'une exploitation cohérente de ces millions de spécimens. À travers le monde, des équipes s'emploient à faire passer ces « dark data » – actuellement inaccessibles via le web – à la lumière numérique.
Les photos haute résolution sont une partie importante du processus de numérisation. Crédit :Smithsonian Institution, CC BY-NC-SA
Ce qui est caché dans les tiroirs et les boîtes
Les paléontologues décrivent souvent les archives fossiles comme incomplètes. Mais pour certains groupes, les archives fossiles peuvent être remarquablement bonnes. Dans de nombreux cas, il existe de nombreux spécimens précédemment collectés dans les musées pour aider les scientifiques à répondre à leurs questions de recherche. La question est de savoir à quel point ils sont accessibles – ou non.
L'immensité des collections de fossiles, et le fait que la plupart de leurs contenus ont été collectés avant l'invention des ordinateurs et d'Internet, rendent très difficile l'agrégation des données associées aux spécimens de musée. D'un point de vue numérique, la plupart des collections de fossiles du monde représentent des « données sombres ». Le fait qu'une grande partie des collections muséales existantes ne soient pas informatisées signifie également que des trésors perdus attendent d'être redécouverts au sein même des musées.
Avec la vision et l'investissement d'agences de financement telles que la National Science Foundation (NSF) aux États-Unis, de nombreux musées collaborent pour rassembler numériquement leurs données à partir d'éléments clés des archives fossiles. Le musée de paléontologie de l'Université de Californie à Berkeley, où je travaille, est l'un des 10 musées qui regroupent maintenant certaines de leurs données sur les fossiles. Ensemble à travers nos collections numérisées, nous travaillons à comprendre comment des changements environnementaux majeurs ont affecté les écosystèmes marins de la côte est de l'océan Pacifique, du Chili à l'Alaska, au cours des 66 derniers millions d'années.
Le processus de numérisation lui-même comprend l'ajout des données de collection du spécimen dans le système informatique du musée si elles n'ont pas déjà été saisies :son identification de l'espèce, où il a été trouvé, et l'âge des roches dans lesquelles il a été trouvé. Ensuite, nous numérisons la localisation géographique du lieu de prélèvement du spécimen, et prendre des images numériques accessibles via le Web.
Le site Integrated Digitized Biocollections (iDigBio) héberge tous les principaux efforts de numérisation des musées aux États-Unis financés par l'actuelle initiative NSF qui a débuté en 2011.
Les membres de l'équipe saisissent des informations sur chaque fossile dans une base de données centralisée. Crédit :Smithsonian Institution, CC BY-NC-SA
Significativement, le coût de l'agrégation numérique des données fossiles en ligne, dont les dizaines de milliers d'images, est remarquablement faible par rapport au coût qu'il a fallu pour collecter les fossiles en premier lieu. C'est aussi moins que le coût du maintien de la sécurité physique et de l'accessibilité de ces ressources inestimables - un coût que les personnes censées être responsables du musée de Rio n'étaient apparemment pas disposées à couvrir, avec des conséquences désastreuses.
Les données numérisées peuvent aider à répondre aux questions de recherche
Notre groupe, appelé EPICC pour les communautés d'invertébrés du Pacifique oriental du Cénozoïque, quantifié à quel point les « données sombres » sont présentes dans nos collections communes. Nous avons découvert que nos 10 musées contiennent des fossiles provenant de 23 fois le nombre de sites de collection en Californie, Oregon et Washington que ce qui est actuellement documenté dans une base de données électronique en ligne de premier plan de la littérature scientifique paléontologique, la base de données de paléobiologie.
EPICC utilise nos données nouvellement numérisées pour reconstituer une meilleure compréhension de la réponse écologique passée aux changements environnementaux. Nous voulons tester des idées pertinentes pour le changement climatique à long et à court terme. Comment la vie s'est-elle remise de l'extinction de masse qui a anéanti les dinosaures ? Comment les changements de température des océans ont-ils entraîné le changement de l'écosystème marin, y compris ceux associés à l'isolement de l'océan Pacifique plus froid de la mer des Caraïbes plus chaude lorsque le pont terrestre à Panama s'est formé pour la première fois ?
Pour répondre à ces questions, toutes les données fossiles pertinentes, tiré de nombreux musées, doit être facilement accessible en ligne pour permettre une synthèse à grande échelle de ces données. La numérisation permet aux paléontologues de voir la forêt dans son ensemble, plutôt que juste comme une myriade d'arbres individuels.
Dans certains cas, tels que les enregistrements de langues passées ou les données de collecte associées à des spécimens individuels, les enregistrements numériques aident à protéger ces ressources inestimables. Mais, typiquement, les spécimens réels restent cruciaux pour comprendre les changements passés. Les chercheurs doivent encore souvent effectuer des mesures clés directement sur les spécimens eux-mêmes.
Une fois numérisé, des informations sur un fossile sont disponibles dans le monde entier, tandis que le spécimen lui-même reste disponible pour les chercheurs invités à faire des observations ou des mesures cruciales. Crédit :Deniz Durmis, photographe contractuel pour le Natural History Museum of Los Angeles County, CC BY-NC-SA
Par exemple, Doctorat de Berkeley L'étudiante Emily Orzechowski utilise des spécimens agrégés par le projet EPICC pour tester l'idée que l'océan au large de la côte californienne deviendra plus froid avec le changement climatique mondial. Les modèles climatiques prédisent que l'augmentation du réchauffement climatique entraînera des vents plus forts le long de la côte, ce qui augmentera l'upwelling côtier qui ramène les eaux glaciales des profondeurs océaniques à la surface - la cause des célèbres brouillards d'été de San Francisco.
Le test qu'elle utilise repose sur la cartographie des distributions d'un grand nombre de fossiles. Elle mesure des différences subtiles dans les isotopes d'oxygène et de carbone trouvés dans les coquilles de palourdes et d'escargots fossiles qui datent de la dernière période interglaciaire de l'histoire de la Terre, environ 120, il y a 000 ans, lorsque la côte ouest était plus chaude qu'elle ne l'est aujourd'hui. L'accès aux fossiles réels est crucial dans ce type de recherche.
Comprendre la réponse aux changements passés ne se limite pas aux fossiles. Par exemple, il y a près d'un siècle, le directeur du Musée de zoologie des vertébrés, Joseph Grinnell à l'Université de Californie, Berkeley, a entrepris des collections systématiques de mammifères et d'oiseaux à travers la Californie. Ensuite, le musée a ré-arpenté ces localités précises, découvrir des changements majeurs dans la répartition de nombreuses espèces, y compris la perte de nombreuses espèces d'oiseaux dans le désert de Mojave.
Un aspect clé de ce travail a été la comparaison de l'ADN de spécimens de musée presque centenaires avec l'ADN d'animaux vivants aujourd'hui. La comparaison a révélé une grave fragmentation des populations, et a conduit à l'identification de changements génétiques en réponse aux changements environnementaux. Avoir les spécimens est crucial pour ce genre de projet.
Cette révolution numérique ne se limite pas aux fossiles et à la paléontologie. Elle concerne toutes les collections des musées. Les conservateurs et les chercheurs sont extrêmement enthousiasmés par le pouvoir à gagner à mesure que les collections des musées du monde - des fossiles aux spécimens d'organismes capturés vivants - deviennent accessibles grâce à la numérisation naissante de nos précieuses collections.
Cet article est republié à partir de The Conversation sous une licence Creative Commons. Lire l'article original.