Université Paris-Sud 11
Master (M2) de Bioinformatique et Biostatistiques 2007-2008
ARNomique et Bioinformatique de l’ARN
Séance du lundi 22 octobre 2007
A.Denise
On sait maintenant qu’aux vingt acides aminés « classiques » on peut en ajouter deux : la Sélénocystéine et la Pyrrolysine. La pyrrolysine, le « 22ème acide aminé », est présente dans des gènes de certaines archae méthanogènes. Une particularité de cet acide aminé est que son codon est aussi un codon stop : UAG. Dans les CDS (Coding DNA sequences) considérés, il y a donc un codon stop UAG en phase. Au cours de la traduction, ce codon peut soit être considéré comme un codon stop « normal » par la machinerie de traduction, auquel cas la traduction s’arrête là, soit considéré comme codant pour une pyrrolysine, auquel cas celle-ci est incorporée dans le peptide en cours de construction et la traduction continue jusqu’au stop suivant.
Selon certains auteurs, une structure secondaire particulière en 3’ du codon UAG favoriserait, dans ces archae, l’incorporation de la pyrrolysine[1]. Une structure en épingle à cheveux a été déterminée en combinant des expériences de probing et des alignements manuels des sites considérés. La figure ci-dessous résume les résultats du probing.
La structure qu’ils proposent, commune à au moins six CDS de trois organismes différents, est la suivante :
Votre travail va consister notamment à tenter de retrouver cette structure[2] en utilisant exclusivement des outils bioinformatiques. On notera aussi que vous ne travaillerez pas vraiment en conditions réelles: en général, on ne connaît pas à l’avance la structure que l’on recherche !
Les gènes connus jusqu’ici pour être soumis à l’incorporation d’une pyrrolysine sont disponibles dans une base de données en ligne : http://www.lri.fr/~zhouyu/pylis/. Sélectionnez dans la base les séquences des gènes mtmB ; demandez les séquences « readthrough », pour n’obtenir que la partie de la séquence à partir du codon UAG en question. Copiez les cinq séquences correspondant à celles de la figure ci-dessus et sauvegardez-les dans un fichier[3]. (La séquence de M. Barkeri mtmB est exactement la même que celle de M. barkeri mtmB1, c’est pourquoi il est inutile de la considérer.)
Tout au long du travail, vous pouvez utiliser VARNA, une applet Java téléchargeable à http://www.lri.fr/~ponty/VARNA, pour visualiser les structures secondaires que vous obtiendrez.
[1] A. Théobald-Dietrich, R. Giegé, J.
Rudinger-Thirion, Evidence for the existence
in mRNA of a hairpin element responsible for ribosome dependant pyrrolysine
insertion into proteins, Biochimie 87 (2005) 813-817.
[2] On notera cependant que la structure proposée n’est pas certaine à 100% car n’a pas été totalement validée.
[3] Il est possible que certaines séquences diffèrent entre la base et la figure ci-dessus car les données ne proviennent pas des mêmes sources.