Conception de génomes par une IA
29/03/2021Connaissez-vous la plateforme web Thispersondoesnotexist (qui signifie, « cette personne n’existe pas ») ? Elle conçoit via une IA des visages d’humains extrêmement réalistes mais entièrement inventés. En Europe, une équipe a poussé l’expérience encore plus loin, en concevant des séquences entières d’ADN humain, une nouvelle fois totalement artificielles. Ces travaux uniques sont apparus dans la célèbre revue PLoS Genetics.
Un algorithme pouvant concevoir des génomes artificiels humains
On se sert des réseaux neuronaux génératifs, de façon performante, dans de multiples et variés secteurs lors de la dernière décennie. Parmi ces domaines, il y a notamment l’imagerie photoréaliste. En utilisant un système semblable avec les informations génétiques, les experts ont fourni un entraînement à leurs réseaux de neurones grâce à des séquences provenant de 2 500 individus, sauvegardées dans des banques d’informations (de données). Le système devait produire des séquences aux spécificités identiques, puis un mélange aux conceptions réelles survenait afin de voir s’il arrivait à voir la différence.
Avec un entraînement extrêmement intensif, les génomes artificiels générés sont parvenus à effectuer une reproduction fidèle des spécificités des génomes réels, comme par exemple les fréquences des allèles (il s’agit de toutes les versions d’un gène). Un des défis les plus conséquents de ces travaux est la vérification de la fiabilité. Beaucoup de temps a été nécessaire à l’analyse des spécificités statistiques des séquences produites.
Uniquement des séquences, et non des génomes entiers
Ces génomes hautement qualitatifs et extrêmement réalistes sont un évènement totalement inédit. Il y avait déjà eu utilisation de ce genre réseau de neurones en génétique pour la génération de courtes séquences (ce qui signifie une dizaine, voire une centaine de paire de bases). Il faut savoir que les briques de l’ADN de l’être humain sont au nombre de près de trois milliards. Néanmoins, générer des séquences aussi longues (qui correspondent à une dizaine de milliers de variants sur des millions de paires de bases) et par rapport à la génétique des populations (pour beaucoup d’individus), c’est inédit. Au final, cela est une véritable progression.
On ne peut pas faire la différence des génomes artificiels avec les autres génomes de la biobanque utilisées afin de concevoir l’algorithme. Or, on sait qu’ils n’appartiennent pas des donneurs réels. Or, l’exercice n’est pas parfait. En effet, un des points faibles majeurs de ce dernier est que, à cause des restrictions de calcul, il est impossible de se servir de ces modèles dans le but de concevoir des génomes artificiels entiers. Ainsi, il faut se contenter de bribes. À part cela, la représentation des allèles extrêmement rares sont difficilement réalisées par l’algorithme. Dernier aspect : il est nécessaire de parfaitement surveiller l’originalité des données générées (cela veut dire qu’elles soient assez différentes des génomes de vrais donneurs).
Analyser le génome humain sans problèmes éthiques en lien avec les informations privées
Réelle prouesse scientifique, ce genre d’IA peut régler les soucis éthiques liés aux banques d’informations génétiques. Dans le domaine de la génétique des populations, les experts doivent souvent effectuer des comparaisons d’informations qu’ils ont conçues à des génomes de référence ou même à un grand panel de référence. La situation parfaite ? Que ces génomes soient le reflet de la diversité génétique. Les génomes artificiels pourraient servir à cela de manière fiable et sûre.
Les bases de données génomiques déjà conçues sont une ressource incroyable et unique pour la recherche biomédicale. Néanmoins, le public ne peut pas y avoir accès et ces dernières sont protégées via des procédures d’application interminables et complexes à cause de l’aspect éthique valable. Les génomes artificiels peuvent permettre de régler ce souci dans un cadre éthique sécurisé et fiable. Dans le futur, ces génomes artificiels pourrait être utiles à une multitude d’applications comme par exemple l’étude du passé évolutif ou l’épidémiologie médicale via l’intégration d’une plus grande diversité génétique.