Comment la conception de novo de protéines fonctionne – et pourquoi c'est important
Les scientifiques peuvent désormais concevoir des protéines entièrement nouvelles à partir de zéro en utilisant des outils d'IA comme RFdiffusion, ouvrant la voie à des médicaments, des enzymes et des matériaux personnalisés que l'évolution n'a jamais créés.
Construire des protéines que la nature n'a jamais imaginées
Les protéines sont les machines moléculaires de la vie. Elles catalysent les réactions, combattent les infections, construisent les tissus et relaient les signaux dans votre corps. Pendant des milliards d'années, l'évolution a façonné chaque protéine sur Terre par le biais de mutations aléatoires et de la sélection naturelle – un processus lent et aveugle. Aujourd'hui, les scientifiques ont appris à contourner complètement l'évolution et à concevoir des protéines entièrement nouvelles à partir de zéro.
Ce domaine s'appelle la conception de novo de protéines, et il a valu à David Baker de l'Université de Washington le prix Nobel de chimie 2024. Combinée aux avancées de l'intelligence artificielle, elle est sur le point de remodeler la médecine, la science des matériaux et la chimie industrielle.
Ce que sont les protéines – et pourquoi la forme est essentielle
Une protéine est une chaîne d'acides aminés qui se replie en une forme tridimensionnelle précise. Cette forme détermine ce que fait la protéine : un léger changement peut transformer une enzyme utile en un amas inutile. Les protéines de la nature ont évolué leurs formes au cours des millénaires. La conception de novo inverse le processus : les scientifiques choisissent d'abord une forme et une fonction souhaitées, puis calculent une séquence d'acides aminés qui se repliera en elle.
Considérez cela comme de l'architecture. La biologie traditionnelle étudie les bâtiments existants pour comprendre comment ils tiennent debout. La conception de novo vous permet de rédiger des plans pour des structures que personne n'a jamais construites – et ensuite de les construire.
Comment fonctionne le processus de conception
La conception de protéines suit trois grandes étapes :
- Définir la structure cible. Les chercheurs spécifient le squelette 3D qu'ils souhaitent – peut-être une poche qui saisit une molécule de médicament ou une cage qui délivre un composant de vaccin.
- Calculer la séquence. Les outils logiciels recherchent une séquence d'acides aminés dont on prévoit qu'elle se repliera de manière fiable dans cette forme. Le programme doit satisfaire des milliers de contraintes physiques : liaisons hydrogène, empilement hydrophobe, interactions électrostatiques.
- Valider en laboratoire. Le gène conçu est synthétisé, inséré dans des cellules, et la protéine résultante est testée pour confirmer qu'elle se replie et fonctionne réellement comme prévu.
Pendant des décennies, la deuxième étape a été le goulot d'étranglement. Les premiers outils étaient lents et avaient de faibles taux de réussite. Cela a radicalement changé avec l'IA.
La révolution de l'IA : d'AlphaFold à RFdiffusion
En 2020, AlphaFold de DeepMind a stupéfié les biologistes en prédisant les structures des protéines avec une précision quasi expérimentale. Le laboratoire de Baker a adapté des architectures d'apprentissage profond similaires – non pas pour prédire les formes, mais pour les générer.
Le résultat a été RFdiffusion, un modèle d'IA générative qui traite la conception de protéines comme la génération d'images. Il commence par un bruit aléatoire et l'affine progressivement en une structure protéique viable, augmentant les taux de réussite expérimentale de deux ordres de grandeur. Un outil complémentaire, ProteinMPNN, trouve ensuite une séquence d'acides aminés optimale en environ une seconde – plus de 200 fois plus rapidement que les logiciels précédents, selon les National Institutes of Health.
La dernière version, RFdiffusion3, peut concevoir des protéines qui interagissent avec l'ADN, les petites molécules et d'autres protéines avec une précision atomique, produisant des enzymes presque aussi efficaces que celles que l'on trouve dans la nature.
Applications concrètes
Les retombées pratiques émergent déjà :
- Médecine : Le groupe de Baker a conçu de petites protéines qui bloquent l'infection par le SRAS-CoV-2, des nanoparticules qui servent de candidats vaccins contre la grippe et des liants qui neutralisent les toxines mortelles du venin de serpent.
- Diagnostics : Des capteurs de protéines personnalisés peuvent détecter des substances comme le fentanyl, offrant des outils de dépistage rapides et peu coûteux.
- Matériaux : Des chercheurs du MIT ont commencé à concevoir des protéines par leur mouvement, et pas seulement par leur forme, ouvrant la voie à des fibres durables et à des alternatives biodégradables aux plastiques à base de pétrole.
- Enzymes industrielles : Les enzymes conçues peuvent catalyser des réactions chimiques qu'aucune enzyme naturelle ne réalise, ce qui pourrait rendre les processus de fabrication plus écologiques.
Défis à venir
Malgré des progrès rapides, des obstacles subsistent. Toutes les protéines conçues ne se replient pas correctement une fois synthétisées, et les taux de réussite – bien qu'ils se soient considérablement améliorés – nécessitent encore le criblage de plusieurs candidats. La conception de protéines avec des fonctions catalytiques complexes et à plusieurs étapes reste plus difficile que la conception de simples liants. Et la traduction des succès en laboratoire en médicaments approuvés ou en produits commerciaux prend des années de tests de sécurité et d'examen réglementaire.
Pourtant, la trajectoire est claire. Avec les outils d'IA désormais open source et s'améliorant rapidement, les Protein Design Archive ont déjà catalogué plus de 1 500 conceptions structurellement confirmées au début de 2025. Les scientifiques ne sont plus limités aux protéines que l'évolution a produites. Ils peuvent désormais construire des machines moléculaires sur commande – un acide aminé à la fois.