Archive

Nucléotides pris en compte

thomas_rey1

Bonjour,

on voit dans le cours que, pour élaborer nos “probabilités de transition” on prend en compte, lorsque la chaîne de Markov est d’ordre k, les k nucléotides précédents. Pourquoi choisir ceux-là ? Ne serait-il pas tout aussi intéressant de prendre les k suivants ? Ou, si k est pair, d’en prendre k/2 avant et k/2 après ?
Merci par ailleurs aux concepteurs de ce cours, que j’apprécie beaucoup.

Cordialement,

Thomas Rey.

FRechenmann

Bonjour,

Je pense qu’Alain Viari répond à votre interrogation dans le début de sa présentation. Il évoque en effet des considérations biologiques (biais de codage et usage du code) qui justifient de travailler triplet par triplet et donc de retenir un ordre 2.

François Rechenmann

thomas_rey1

Bonjour,

merci pour votre réponse. Je comprend pour l’ordre 2 à présent.
Toutefois, même en se restreignant à l’ordre 2, pourquoi ne tenir compte que des 2 nucléotides précédents et pas, par exemple, des deux suivants ou du précédent et du suivant.

Ainsi, si le nucléotide “mystère” est en phase 2 (en notant ce nucléotide par un ? et ses voisins que j’utilise dans les conditionnements de mes probabilités conditionnelles par des V), je pourrais être tenté (pour des raisons de regroupement 3 par 3 avec respect de la phase choisie) de regarder :
1 2 3
V ? V
plutôt que ce que je regarderais en prenant systématiquement les deux précédents :
1 2 3 1 2 3
. . V V ? .

Je ne sais pas si je me fais bien comprendre, désolé si ce n’est pas très clair.
Cordialement,

Thomas Rey

FRechenmann

A la 4e minute de la vidéo, Alain Viari explique un des fondements du modèle des chaînes de Markov. La probabilité de rencontre d’un caractère ne dépend que des caractères précédents (la séquence est orientée).