Des chercheurs de l'Institut d'ingénierie moléculaire et du Laboratoire national d'Argonne ont développé une plate-forme pour fournir des données consultables sur les publications des scientifiques afin de résoudre le problème de la reproductibilité. Crédit :shutterstock.com
La communauté scientifique est aux prises avec le problème de la reproductibilité des données, une étape clé du processus qui guide la façon dont la plupart des scientifiques créent des connaissances dans leur domaine.
Selon un récent sondage, plus de 70 pour cent des chercheurs ont essayé et échoué à reproduire les expériences publiées par un autre scientifique. Plus de la moitié n'ont même pas réussi à reproduire leurs propres enquêtes avec succès. Cela pose la question :si une expérience ou une simulation ne peut pas être reproduite, a-t-il réussi en premier lieu ?
Des chercheurs de l'Institute for Molecular Engineering de l'Université de Chicago et du Argonne National Laboratory visent à aider à résoudre ce problème avec une nouvelle plate-forme logicielle qui permet aux scientifiques de partager les données de chacune de leurs publications de manière interrogeable. Au cours des deux dernières années, ils ont développé un outil de conservation, découvrir et explorer des articles scientifiques reproductibles appelés Qresp, qui est maintenant disponible pour un usage public.
"Notre objectif est d'accélérer le processus scientifique et de réduire le temps nécessaire au partage des connaissances entre les chercheurs, " dit Giulia Galli, le professeur de la famille Liew de génie moléculaire. "En rendant les données disponibles et consultables, nous espérons permettre aux chercheurs de reproduire plus facilement les résultats. »
Le processus de reproduction des résultats scientifiques reste un enjeu complexe. Articles publiés, qui sont disponibles en ligne au format PDF, n'incluent souvent pas suffisamment d'informations sur les données et les processus résultants pour que d'autres puissent reproduire les résultats, et les données ne sont souvent pas mises à la disposition de la communauté scientifique.
« De nombreux articles ne contiennent pas suffisamment de détails pour pouvoir reproduire les données, " a déclaré Marco Govoni, scientifique adjoint à Argonne et chercheur invité à l'Université de Chicago. "Et souvent, la majorité des données obtenues et utilisées dans le document ne sont pas du tout disponibles. Pour obtenir ces données, parfois, vous devez écrire aux auteurs de l'article. ça ne devrait pas être si difficile, et ce ne devrait pas être un processus ad hoc. »
Avec Qresp, les chercheurs espèrent contribuer à atténuer certaines des difficultés actuelles à rendre les données ouvertes et reproductibles. Le logiciel guide les utilisateurs dans le processus d'organisation et de partage de leurs données, y compris les jeux de données et les graphiques. Tous les champs sont personnalisables, laisser les chercheurs organiser leurs données de la meilleure façon possible en fonction de l'article qu'ils ont rédigé. La plateforme est également disponible pour tous ceux qui souhaitent explorer des données partagées par d'autres chercheurs.
Bien qu'il y ait eu plusieurs efforts pour gérer de grands ensembles de données, la plupart de ces efforts reposent sur un référentiel central, tandis que Qresp repose sur un modèle distribué. Au sein de la plateforme, les chercheurs ne téléchargent pas de données mais hébergent plutôt leurs propres données et décident de ce qu'ils veulent partager. De cette façon, Qresp fournit une solution évolutive de partage de données, dit Govoni.
Les chercheurs qui pourraient ne pas vouloir franchir cette étape supplémentaire pour partager leurs données juste après la publication devraient considérer les avantages de l'organisation et du partage des données pour leur propre groupe, dit Galli. Les étudiants de son groupe organisent désormais automatiquement leurs données dans Qresp comme une étape supplémentaire dans leur recherche scientifique. Qresp facilite le transfert d'informations et de connaissances entre les projets menés par différents étudiants, et entre les chercheurs qui restent et ceux qui quittent le groupe.
"L'ensemble du processus de partage des données dans le groupe est devenu beaucoup plus efficace, " dit Galli, qui est également professeur de chimie et chercheur principal à Argonne.
Avec l'utilisation et l'adoption de Qresp par une large communauté de chercheurs, les articles publiés peuvent devenir beaucoup plus interactifs - une interface vivante où, en cliquant sur une image, un chercheur peut voir l'ensemble de données derrière les résultats.
"Nous voulons élever la barre pour la reproduction des résultats scientifiques, et nous voulons aller au-delà de la publication de PDF et partager des recherches beaucoup plus interactives et utiles, " a déclaré Govoni.