• Home
  • Chimie
  • Astronomie
  • Énergie
  • La nature
  • Biologie
  • Physique
  • Électronique
  • L'IA pour la sélection végétale dans un climat en constante évolution

    Champ de sorgho, une culture importante utilisée comme aliment et dans la production de biocarburants. Crédits :Pixabay

    Comment l'intelligence artificielle (IA) pourrait-elle avoir un impact sur l'agriculture, l'industrie alimentaire, et le domaine de la bio-ingénierie? Dan Jacobson, un membre du personnel de recherche et développement de la division des biosciences du laboratoire national d'Oak Ridge (ORNL) du département américain de l'Énergie (DOE), a quelques idées.

    Depuis 5 ans, Jacobson et son équipe ont étudié les plantes pour comprendre les variables et les modèles génétiques qui les rendent adaptables aux environnements et aux climats changeants. En tant que biologiste informatique, Jacobson utilise certains des supercalculateurs les plus puissants au monde pour son travail, notamment le Cray XK7 Titan récemment mis hors service et le supercalculateur le plus puissant et le plus intelligent au monde pour la science ouverte, le supercalculateur IBM AC922 Summit, tous deux situés à Oak Ridge Leadership Computing Facility (OLCF), une installation d'utilisateurs du DOE Office of Science à l'ORNL.

    L'année dernière, Jacobson et son équipe ont remporté un prix Gordon Bell de l'Association for Computing Machinery après avoir utilisé une technique informatique spéciale connue sous le nom de « précision mixte » sur Summit pour devenir le premier groupe à atteindre une vitesse exascale, soit environ un quintillion de calculs par seconde.

    L'équipe de Jacobson travaille actuellement sur de nombreux projets qui forment une feuille de route intégrée pour l'avenir de l'IA dans la sélection végétale et la bioénergie. Le travail de l'équipe a été présenté dans Tendances en biotechnologie en octobre.

    Dans ce Q&R, Jacobson parle des travaux de son équipe sur un algorithme de sélection génomique, sa vision de l'avenir de la génomique environnementale, et l'espace où la simulation rencontre l'IA.

    Sur quoi votre équipe a-t-elle travaillé l'année dernière ?

    Jacobson :Nous avons travaillé sur deux ou trois choses. Récemment, nous avons développé de nouvelles façons de faire ce qu'on appelle la « sélection génomique, " ou la conception d'un organisme à des fins de reproduction. Nous avons développé un nouvel algorithme de sélection génomique basé sur des méthodes émergentes d'apprentissage automatique appelées collectivement " IA explicable, " qui est un domaine qui améliore les méthodes d'IA de classificateur de boîte noire en essayant de comprendre comment ces algorithmes prennent des décisions.

    Cet algorithme nous aide à déterminer quelles variations d'un génome nous devons combiner pour produire des plantes capables de s'adapter à leur environnement. Cela informe les efforts de sélection, efforts d'édition de gènes, ou des combinaisons de ceux-ci, selon le type de stratégie de bio-ingénierie que vous souhaitez adopter.

    L'année dernière, vous avez remporté un prix Gordon Bell après avoir franchi la barrière exascale avec un code qui vous permet d'étudier les interactions combinatoires entre les organismes et leurs environnements. Comment cet algorithme s'intègre-t-il dans cette recherche?

    Jacobson :Nous utilisons toujours le modèle que nous avons utilisé l'année dernière, mais maintenant, nous avons introduit cet algorithme de sélection génomique basé sur l'IA dans notre code Combinatorial Metrics [CoMet] et nous lui fournissons des informations environnementales tous les jours de l'année, nous pouvons donc faire des études d'association à l'échelle du génome à travers le temps climatique.

    En outre, nous avons étendu à l'échelle mondiale nos efforts dans ce que nous appelons les « types climatiques », c'est-à-dire les informations climatiques et environnementales auxquelles les plantes s'adaptent. Avec l'aide de Peter Thornton de l'ORNL et l'expertise de son groupe en biogéographie et climat, nous avons construit des modèles de chaque kilomètre carré de terre sur la planète et encodé 50 ans de données environnementales et climatiques dans ces modèles, allant du sol, grâce à la qualité spectrale de la lumière, et tout le reste.

    Pour comprendre toutes les relations entre les différents environnements, nous avons comparé ces environnements entre eux sur Summit en utilisant un nouvel algorithme appelé Duo que nous avons ajouté à notre base de code CoMet. A notre connaissance, c'est le plus grand calcul scientifique jamais fait.

    Cela ressemble à un accomplissement assez lourd. Quels types d'informations ces comparaisons peuvent-elles vous donner ?

    Jacobson :Ces comparaisons peuvent nous aider à déterminer exactement où nous pouvons cibler certains environnements et quelles mutations génétiques et allèles nous devons inclure pour aider ces plantes à s'adapter à différents environnements. Nous pouvons regarder un environnement et dire, « Pour cet environnement, c'est ce dont nous aurons besoin dans le génome de cette plante pour qu'elle se développe aussi bien que possible."

    Est-ce l'avenir de la génomique environnementale ?

    Jacobson :La vision intégrée que nous voyons est la connexion de toutes les couches "-omiques", de la génomique (expression des gènes), protéomique (expression des protéines), et la métabolomique (expression des métabolites) jusqu'aux phénotypes – traits observables ; donc, du génome au phénomène et tout le reste.

    Idéalement, nous aimerions avoir une combinaison de données de génotype avec des données climatiques et environnementales dans un modèle intégré, des nucléotides simples - les structures moléculaires qui composent l'ADN - jusqu'à l'environnement et le climat à l'échelle planétaire. De tels modèles intégrés complets sont désormais possibles parce que nous avons en fait calculé l'échelle spectrale de la lumière de chaque point de la planète - c'est un phénotype astrophysique qui vient de notre étoile la plus proche, le soleil.

    D'abord, nous devons examiner les interactions combinatoires dans de tels modèles pour voir comment elles conduisent aux propriétés émergentes que nous essayons d'optimiser dans les plantes pour la productivité et la durabilité futures. Puis, nous pouvons relier cela à la façon dont les plantes se sont historiquement adaptées aux environnements afin de concevoir de nouveaux génotypes idéaux pour la bioénergie ou la production alimentaire qui sont optimisés pour prospérer dans des environnements spécifiques.

    Est-ce quelque chose qui sera nécessaire dans l'agriculture à l'avenir?

    Jacobson :Alors que le monde change, il y a une pression croissante pour utiliser « des terres marginales, " c'est-à-dire des terres qui ne sont souvent pas actuellement utilisées pour l'agriculture ou qui ne sont pas utilisées efficacement pour l'agriculture. si nous concevons des génotypes qui prospèrent dans ces environnements marginaux, nous pourrons augmenter notre production alimentaire en plus de notre production d'énergie. Il s'agit d'une technologie à double usage.

    Nous sommes également très préoccupés par la surfertilisation des terres, car elle peut entraîner un ruissellement qui a de grandes conséquences écologiques. Si nous pouvons optimiser les plantes pour utiliser les nutriments qui sont là avec peu d'engrais supplémentaire, c'est aussi un grand avantage pour la durabilité. Donc, nous essayons vraiment d'examiner cela de manière holistique et de construire autant de ces adaptations que possible dans le modèle afin que nous connaissions les effets dans certains environnements.

    Que vas tu travailler par la suite?

    Jacobson :La prochaine étape consiste à examiner les données historiques et toutes ces relations, puis à faire des projections afin que nous puissions réellement concevoir des génotypes qui non seulement prospéreront dans les zones environnementales actuelles, mais continueront à prospérer à l'avenir à mesure que le réseau mondial change. La capacité de se projeter vers l'avant, tant pour les cultures annuelles que pour les cultures pérennes à long terme, est vraiment important.

    Quels sont les défis restants ?

    Jacobson :Tout ce que nous faisons est un poids lourd, mais nous regardons comment nous pouvons concevoir cette nouvelle approche sur Summit et le futur système exascale de l'OLCF, Frontière, afin que nous puissions vraiment comprendre toutes ces relations. Aussi, maintenant que nous avons ces données à toutes ces couches "-omiques", nous devons exécuter ces combinaisons de couches—appelées polytopes—des milliers ou des dizaines de milliers ou des centaines de milliers de fois. Le prochain ensemble d'algorithmes que nous construisons consiste à trouver toutes les relations et associations possibles dans et à travers tous les polytopes. C'est la prochaine frontière.

    Votre travail recoupera-t-il du tout les modèles traditionnels de simulation climatique ?

    Jacobson :Il s'agit d'une vue des informations climatiques basée sur les données et l'IA, ce qui est différent d'une approche de simulation. Heures supplémentaires, il sera intéressant de voir où ils se croisent, et il peut y avoir des choses que nous apprenons ici qui sont très instructives pour les modèles climatiques et vice versa. Nous savons également que ce même type de technologie d'IA explicable peut être d'une grande aide pour les études de simulation. Idéalement, nous pourrions développer des modèles explicables basés sur l'IA qui peuvent aider les modèles de simulation avec certains de leurs goulots d'étranglement. Si nous pouvons apprendre les modèles de simulation des modèles utilisés et remplacer certains de leurs goulots d'étranglement par un résultat appris, alors ces modèles peuvent faire des choses plus créatives. C'est vraiment là que nous pourrions voir une partie de cet espace se croiser à l'avenir.


    © Science https://fr.scienceaq.com