in

L’ère de l’apprentissage automatique pour la conception de protéines, résumée en quatre méthodes clés | par LucianoSphere | Mai 2023


DESIGN ET INGÉNIERIE DES PROTÉINES GRÂCE À L’INTELLIGENCE ARTIFICIELLE : UNE PERSPECTIVE SUR LEURS AVANCÉES GRÂCE À QUATRE OUTILS NOTABLES

La conception et l’ingénierie des protéines sont des objectifs essentiels en biologie moléculaire, avec des applications variées dans différents domaines tels que la médecine, la biotechnologie et la science des matériaux. Les scientifiques ont exploré depuis plusieurs décennies diverses approches pour concevoir de nouvelles protéines et pour améliorer les propriétés de celles existantes. Bien que les approches basées sur la physique aient connu un certain succès pour trouver des séquences d’acides aminés qui se replient en une structure de protéine donnée, les récents développements en matière de méthodes d’apprentissage en profondeur ont montré des taux de réussite et de polyvalence beaucoup plus élevés. Dans cet article, nous présenterons quatre outils de machine learning (ML) notables pour la conception et l’ingénierie des protéines et leur importance pour faire avancer le domaine.

L’IMPACT DE CES OUTILS

Au-delà de l’impact que ces outils auront immédiatement dans les sciences chimiques et biologiques, les méthodes qu’ils introduisent, voire les projets eux-mêmes, offrent des opportunités passionnantes pour que les scientifiques des données, les praticiens de l’apprentissage en profondeur et les chercheurs en IA puissent accéder à de nouvelles idées et trouver des moyens de collaborer avec des scientifiques en chimie et en biologie pour appliquer l’informatique à des fins bénéfiques. En effet, les outils que nous examinerons ci-dessous démontrent la puissance de l’application de différents types d’algorithmes d’apprentissage en profondeur pour relever un défi particulièrement complexe en biotechnologie. En exploitant ces outils, les professionnels de la science des données, de l’apprentissage en profondeur et de l’intelligence artificielle peuvent donc contribuer aux avancées dans la médecine, la biotechnologie et la science des matériaux, tout en constatant l’impact direct de leur propre domaine d’expertise en dehors de celui-ci.

LES OUTILS

Dans l’ordre de leur sortie, nous présenterons les outils suivants : ProteinMPNN, ESM2-InverseFold, RoseTTaFold Diffusion et MASIF-Seed.

ProteinMPNN est le premier outil de ML pour la conception de protéines à avoir été publié avec des protéines conçues testées expérimentalement. Ce modèle est basé sur un réseau de neurones encodeur-décodeur et est le premier outil de ce type à avoir réussi à générer des séquences de protéines vérifiées expérimentalement qui se replient comme prévu. Il a été démontré que ProteinMPNN est applicable à divers problèmes de conception de protéines. développé par Meta, ESM2-InverseFold est basé sur le modèle de langage ESMFold pour générer des séquences de protéines expérimentales à partir de structures. ESM2-InverseFold est une version de ESMFold, conçue pour générer des séquences de protéines à partir de structures plutôt que de prédire des structures à partir de séquences. Cette méthode a montré un haut taux de réussite expérimentale dans la production de protéines solubles et monomériques.

RoseTTaFold Diffusion est un modèle de génération basé sur un modèle de diffusion de suppression de bruit qui utilise l’apprentissage en profondeur pour générer des protéines complexes, fonctionnelles et diverses à partir de spécifications moléculaires simples. RoseTTaFold Diffusion peut prendre en compte des critères d’entrée tels que des informations sur la séquence, le pliage ou encore des motifs fonctionnels. Le modèle utilise un processus de simulation par marquages pour générer des structures de protéines. Il permet aussi de générer des structures de protéines à partir de certaines entrées sans entrée supplémentaire.

MaSIF-seed est un outil qui se concentre sur la conception des interactions protéiques via des empreintes digitales de surface protéiques apprises. Il a montré qu’il est capable de concevoir des monomères et des oligomères de protéines, y compris des protéines de liaison à la cible et des repliements qui n’ont jamais été observés dans la nature.

CONCLUSION

Ces progrès récents devraient être encourageants pour ceux qui veulent créer des protéines personnalisées pour les applications de la vie réelle. Les capacités de ces outils de conception de protéines ont des implications importantes pour la médecine, la biotechnologie et la science des matériaux, ainsi que pour l’application de l’intelligence artificielle dans ces domaines. Les découvertes et les développements issus de ces outils devraient permettre une avancée significative dans les recherches sur les protéines, offrant la possibilité de réinventer la manière dont la science aborde cette question cruciale, avec des répercussions positives pour la santé humaine, la durabilité environnementale et l’innovation technologique.

What do you think?

Written by Barbara

Leave a Reply

Your email address will not be published. Required fields are marked *

Ultima – Plus de 750 illustrations gratuites pour vos projets créatifs

Former le model de segmentation d’image pour accepter les commentaires des utilisateurs par le biais de l’étiquetage Voronoi, Partie 2 | Par Florin Andrei | Mai 2023