Déchiffrer l’énigme des protéines

Cette année, le prix Nobel de chimie est attribué à trois chercheurs qui ont contribué de manière déterminante à déchiffrer le code des protéines, ces importants éléments constitutifs de la vie. Mais pour que des applications puissent être développées à partir de ces connaissances, par exemple dans le domaine médical, des centres de recherche comme le PSI sont indispensables. 

Les protéines sont impliquées dans tous les processus de la vie. Ces structures composées de séquences d’acides aminés forment des structures complexes qui sont déterminantes pour la fonction des protéines. C’est la raison pour laquelle la possibilité de prédire la structure d’une protéine sur la base de sa séquence d’acides aminés à l’aide d’une IA revêt une telle importance pour comprendre le vivant et innover dans le domaine médical et biologique. © hotspianiegra - stock.adobe.com

Cette année, le prix Nobel de chimie a surpris à plus d’un titre. D’une part, seul un des trois lauréats, David Baker, est un scientifique affilié à un centre de recherche académique. Les deux autres scientifiques, Demis Hassabis und John Jumper, sont des employés de DeepMind, une filiale de Google. De l’autre, cette distinction récompense une intelligence artificielle (IA) basée sur un projet de science ouverte, qui n’aurait pas été possible sans les vastes banques de données ouvertes et de haute qualité de la communauté scientifique mondiale. L’Institut Paul Scherrer PSI a été l’un de ces importants fournisseurs. Ces circonstances inhabituelles pourraient presque faire oublier la raison pour laquelle cette distinction a été décernée: le Comité Nobel a récompensé les trois scientifiques pour une percée révolutionnaire dans le domaine de la recherche sur les protéines. Deux d’entre eux ont en effet développé une IA baptisée AlphaFold au sein de la société DeepMind. Cette IA est capable de prédire à l’ordinateur la structure spatiale d’une protéine avec une précision surprenante. Cette structure est une espèce de pliage qui découle de la succession des acides aminés qu’elle contient.

Le pliage tridimensionnel est déterminant 

La portée des nouvelles possibilités offertes par AlphaFold ne peut pas être encore totalement évaluée. Les protéines et leur pliage tridimensionnel forment la base centrale des systèmes biologiques et leur perturbation peut donc avoir des conséquences fatales. Les protéines contrôlent la forme, la fonction et l’activité de toutes les cellules, autrement dit des quelque 30 000 milliards de cellules qui composent le corps humain, y compris les cellules du système immunitaire, du cerveau, mais aussi les cellules cancéreuses qui sont transformées de manière pathologique. Les structures extra-cellulaires produites par les cellules sont également composées de protéines. Parmi celles-ci figure notamment le collagène qui assure la structure et la fermeté de la peau, des os, des tendons et des tissus conjonctifs. Mais jusqu’ici, la communauté scientifique se retrouvait régulièrement face à une énigme: celle de savoir comment la structure tridimensionnelle d’une protéine découle de la séquence d’acides aminés, par ailleurs facile à déterminer.

Cette structure spatiale, décisive pour la fonction biologique, est déterminée par les chercheurs dans le cadre d’expériences très complexes de cristallographie aux rayons X, qui durent souvent des années. Ce n’est que depuis quelques années que la détermination de structures de protéines est possible également grâce à une forme de microscopie électronique à très haute résolution. La détermination de structures de protéines avec la cristallographie aux rayons X a réussi pour la première fois en 1959 avec de la myoglobine, une protéine musculaire responsable du transport intramusculaire de l'oxygène. Les scientifiques emmenés par Max Perutz, prix Nobel de Chimie en 1962, ont cristallisé la protéine avant de l’irradier avec de la lumière monochromatique de type rayons X, comme celle qui est disponible à la Source de Lumière Suisse SLS au PSI. Le diagramme de diffraction de la lumière ainsi obtenu permet d’identifier le pliage et, ce faisant, d’obtenir des informations sur le fonctionnement d’une protéine déterminée: par exemple d’identifier où se situent les centres actifs qui permettent les interactions avec les petites molécules. 

Lorsqu’AlphaFold a été développée, environ 140 000 structures de protéines avaient déjà été déterminées de manière expérimentale. Elles étaient toutes répertoriées dans la Protein Data Bank (PDB), fondée en 1971 et librement accessible aux scientifiques comme au grand public. «Plus de 5 % des données qu’elle contient proviennent de la SLS au PSI», précise Jörg Standfuss, responsable du Laboratoire de recherche biomoléculaire, qui se focalise sur la biologie structurale au PSI Center for Life Sciences. Le reste vient essentiellement d’autres centres de recherche dotés d’une source de rayons X de haute qualité. 

Prédictions très précises 

C’est l’énorme quantité de données de la PDB et sa disponibilité qui ont permis le développement d’AlphaFold et donc le prix Nobel de chimie 2024. Le modèle de cette IA combine des informations sur la séquence d’acides aminés et sur les forces physiques qui contrôlent le pliage des protéines avec les structures tridimensionnelles déterminées de manière expérimentale. Grâce à cette approche, AlphaFold a prédit et mis à la disposition du grand public plus de 200 millions de structures en un temps record. «Pour les protéines simples, la précision de la prédiction est aujourd’hui très bonne, explique Jörg Standfuss. Mais les processus dynamique qui se jouent dans les protéines ne peuvent toujours pas être prédits et les interactions avec les substances actives, essentielles dans le développement de médicaments, ne peuvent l’être que de manières limitée.» Les données expérimentales mesurées au laser à électrons libres SwissFEL et à la SLS au PSI, avec une recherche de pointe dans le domaine de la détermination de structures de la dynamique des protéines et de la détermination automatique de structures protéiques avec de petits partenaire de liaison chimique, contribuent de manière essentielle à la biologie structurale moderne. Après sa mise à niveau, la SLS 2.0 ouvrira ses portes en 2025 et permettra de déchiffrer des structures expérimentales en quelques secondes. Ces structures formeront la base nécessaire aux prochaines générations de modèles d’IA, estime Jörg Standfuss. 

Dr Jörg Standfuss
Center for Life Sciences
Institut Paul Scherrer PSI

+41 56 310 25 86
joerg.standfuss@psi.ch