Archive

Algorithme d’alignement : question générale

GFab

Bonjour,

Je me posais une question d’ordre général sur les algorithmes actuels et leurs performances : est-il aujourd’hui possible, à partir d’une protéine exprimée (et donc de sa séquence d’acides aminés) de retrouver automatiquement sa localisation au niveau du gène (i.e. l’emplacement des exons sur la séquence de nucléotide d’un chromosome) ? Et si oui, je me demandais quelle était la complexité typique de ce type d’algorithme.

FRechenmann

Bonjour,

Un tout premier point à prendre en considération est le suivant : autant à un triplet de nucléotides d’une séquence codante (un codon donc) correspond, à travers le code génétique, un et un seul acide aminé, autant l’inverse n’est pas vrai du fait du caractère redondant du code génétique.

Concrètement, cela signifie que, pour chaque acide aminé de la séquence protéique, plusieurs triplets de nucléotides (codons synonymes) sont candidats pour figurer dans la séquence nucléotidique.

Certes, la connaissance de l’usage du code par l’organisme autorise des considérations probabilistes, mais il apparaît que la combinatoire restera élevée.

Qu’en pensez-vous ?

GFab

Bonjour,
Je vous remercie pour votre réponse. Effectivement, il n’y a pas de bijection entre le codon ADN et l’AA, je comprends donc bien la difficulté. Ma question était mal posée : supposons plutôt qu’on parte d’une séquence d’ARN, pourrait-on aujourd’hui facilement (complexité linéaire ou polynomiale) remonter aux exons qui l’ont générée ? Avec des algorithmes type blast ?