18 mars 2024
IRMAR
Fuseau horaire Europe/Paris

Prédiction de l'expression des gènes à partir de données épigénomiques chez le Fusarium à l’aide de méthodes de machine learning et de Deep Learning

18 mars 2024, 11:00
20m
Amphi Lebesgue (IRMAR)

Amphi Lebesgue

IRMAR

Campus de Beaulieu Rez-de-chaussée du bâtiment 22-23 35042 Rennes France

Orateur

Mme Mathilde Bruguet (Institut Agro, MycSA)

Description

Le Fusarium est un bioagresseur du blé, connu pour ses capacités d’adaptation rapide aux changements environnementaux, dues à des variations épigénétiques. À des intervalles de temps courts, les variations épigénétiques peuvent permettre des changements phénotypiques dûs à la modification de l’expression génique, sans changement de la séquence génomique. Ainsi, les génomes et épigénomes interagissent avec l’environnement et contribuent à l’adaptation des organismes et à leurs capacités de résilience. Néanmoins, d’autres variations génétiques entrent en jeu dans les phénomènes d’adaptation, c’est pourquoi ici nous utilisons des données sur le Fusarium qui est un organisme se reproduisant de manière clonale et où l’adaptation par variation génétique est moindre. L’étude des variations d’expression est donc envisagée ici par l’étude des mécanismes épigénétiques, notamment par la variation de l’accessibilité de la chromatine qui joue un rôle majeur dans la transcription d’un gène et donc dans son expression. On obtient ces informations grâce à un séquençage MAINEseq et l’expression des gènes est obtenue par séquençage RNAseq. Une première approche statistique vise à l’apprentissage de la structure épigénomique le long du gène afin de traduire son expression à l’aide d’une grande variété de méthodes de machine learning (régression linéaire, random forest, et deep learning), ce qui a conduit à des résultats peu concluants. Partant de l'observation que le signal d'expression dans l'amorce de la partie codante du gène est à la fois bien corrélé au signal épignéomique et à l'expression complète du gène, nous proposons une nouvelle méthode d’apprentissage où les signaux de motifs épigénétiques sont utilisés pour prédire le signal d’expression, cette fois le long de la séquence nucléotidique, dans une démarche de prédiction dite function-to-function.

Auteurs principaux

M. David Causeur (IRMAR, Institut Agro) M. Gaël Le Trionnaire (IGEPP) Mme Magalie Houé-Bigot (Institut Agro Rennes Angers) Mme Mathilde Bruguet (Institut Agro, MycSA) Mme Nadia Ponts (MycSA) M. Romain Tavenard (Université de Rennes 2) Mme Romane Leroy (Institut Agro) Mme Santa Kirezi (Institut Agro)

Documents de présentation

Aucun document.