Les scientifiques ont utilisé Diamond Light Source pour développer une nouvelle méthode pour extraire des informations précédemment cachées des données de diffraction des rayons X qui sont mesurées lors de la résolution des structures atomiques tridimensionnelles (3D) des protéines et d'autres molécules biologiques.
En essayant de faire évoluer des composés chimiques vers de puissants candidats médicaments, les scientifiques tentent d'étudier les détails atomiques de la façon dont les composés se lient à leurs protéines cibles. Faire cela, ils comparent les données de rayons X mesurées à la fois en présence et en l'absence du composé. Cependant, avec les algorithmes d'analyse existants, ce signal de différence peut souvent être submergé par le bruit des artefacts d'expérience, rendant très peu fiable l'interprétation du signal observé.
La nouvelle méthode Pan-Dataset Density Analysis (PanDDA) extrait l'image du composé lié avec des détails exceptionnellement clairs et sans ambiguïté. PanDDA identifie d'abord la source du bruit, puis le supprime des données. Il exploite la capacité de Diamond à répéter rapidement des dizaines à des centaines de mesures, qui sont ensuite caractérisés pour les différences entre eux, indiquant la présence d'un composé lié, après quoi une correction de bruit est appliquée en 3D. Les résultats sont publiés aujourd'hui dans Communication Nature .
Cristallographie macromoléculaire (MX), la technique à laquelle s'applique PanDDA, est l'un des outils les plus puissants utilisés par les chercheurs intéressés à déterminer les structures 3D de grandes molécules biologiques, y compris les protéines, et est l'expérience de travail pour la conception rationnelle de médicaments.
"Le problème de l'identification des événements de liaison dans les ensembles de données cristallographiques peut ressembler à la recherche d'une aiguille dans une botte de foin, " explique le Dr Nicholas Pearce, auteur principal de l'article issu de son projet de doctorat à l'Université d'Oxford dans le Centre de formation doctorale des approches systémiques pour les sciences biomédicales (SABS), où il a été cofinancé par UCB Pharma et Diamond. "Dans le cas des données que nous analysions, c'était encore pire, parce que nous avions des centaines de meules de foin, et ne savait pas lequel d'entre eux contenait des aiguilles. » Nick est maintenant basé dans le Crystal &Structural Chemistry Group à l'Universiteit Utrecht.
Les chercheurs ont pu utiliser à leur avantage le fait que la plupart des mesures provenaient de cristaux « vides » qui ne contenaient pas de ligand lié, leur permettant de caractériser la forme non liée et de rechercher simplement des ensembles de données différents.
« Souvent en cristallographie, vous pouvez manquer des formes liées « faibles », parce que chaque mesure est une superposition des formes liées et non liées, " poursuit le Dr Pearce. " Cela s'apparente à plusieurs feuilles de papier calque, chacun avec l'une d'au moins deux images, tous superposés les uns sur les autres."
"Lorsque vous essayez d'identifier l'image sur une seule des 'feuilles', il est confus par ce qui transparaît de toutes les autres feuilles, donc l'image devient sujette à des erreurs d'interprétation, " ajoute le Dr Pearce. " Pour surmonter cela, nous avons développé une méthode pour extraire le bon ensemble de « feuilles » à partir de la superposition ; une fois qu'on a fait ça, l'interprétation de la forme liée devient beaucoup plus facile, et nous permet d'interpréter les données en toute confiance, et construire des modèles des états intéressants dans les données."
"L'idée de base est conceptuellement très simple, à savoir traiter la superposition confuse comme un problème de correction de fond, " explique le professeur Frank von Delft, qui est conjointement chercheur principal du groupe de cristallographie des protéines du Structural Genomics Consortium (SGC) de l'Université d'Oxford, et scientifique principal de la ligne de lumière I04-1 à Diamond. "Toutefois, une estimation précise du bruit de fond est cruciale, et en pratique c'était impensable jusqu'à l'avènement de la nouvelle technologie robotique proposée par Diamond, ce qui rend routinier de faire un si grand nombre de mesures."
« UCB est ravi d'avoir travaillé en étroite collaboration avec Diamond sur le développement de PanDDA et son application au criblage de fragments cristallographiques, " commente le Dr Neil Weir, Vice-président senior de la découverte chez UCB Pharma. « En conséquence directe, nous avons pu identifier des fragments, qui ne se distinguaient pas autrement de l'arrière-plan, lié à une cible médicamenteuse d'interaction protéine-protéine clé.
La recherche a impliqué la production d'environ 860 ensembles de données, dont seulement 75 contiennent une forme liée d'intérêt pour les chercheurs. "Bien qu'applicable en général au MX, la méthode est particulièrement transformatrice pour une version de l'expérience MX appelée criblage de fragments, où les effets recherchés sont très rares et encore plus difficiles à vérifier par les algorithmes classiques, " poursuit von Delft.
Une coda cruciale pour le travail a été le téléchargement de toutes les structures dans la Protein Data Bank (wwPDB), le référentiel en ligne des structures 3D de protéines et d'acides nucléiques, où tout le monde a un accès totalement gratuit à toutes les structures jamais publiées. L'un des sites hôtes de wwPDB, APD RCSB, a récemment développé un nouvel outil de dépôt groupé pour permettre le téléchargement en masse de structures, et cela a été crucial pour mener à bien cette collaboration.
The RCSB PDB Group Deposition system allows authors to take advantage of local templates and PDB_extract for batch processing, packing, upload, review, validation, and one-click submission of many structures at once. Searching group title "PanDDA analysis group deposition" at rcsb.org will return these 860 depositions.
"The Diamond and PDB groups have accomplished something quite incredible, and we have been delighted to help them" says Aled Edwards, Director of the SGC. "I would also like to highlight the team's commitment to open science. By placing all the research output into the public domain, they have ensured that the data can be used by all."
Now celebrating its 10th year of research and innovation, Diamond is committed to working with our users to enable them to carry out world-leading research at the facility.
"We've come a long way in the last ten years, and collaborations like these are key to how we will maintain our place as a key facility for researchers working in the life sciences, " adds Professor Dave Stuart, Director of Life Sciences at Diamond. "The idea that we can clearly see weak binding events is particularly exciting and something we're looking forward to sharing with our crystallography community."
The researchers hope that this new method will provide a significant shift in how crystallographic models are generated; opening windows to explore more poorly ordered crystals.