Archive

La marche et le ratio de l’information

eleho

Bonjour,
La marche de Borrelia correspond à la méthode du ratio GC.borreliaWalk borreliaGC.
L’origine de réplication se situe aux environs du 450000ème nucléotides.
Je me suis amusé à tracer sur le graphe le cumul de chaque A, C, G et T:Borrelia.
On peut voir que A et T puis C et G s’écarte puis se rejoignent. L’écartement maximal entre ces paires sz situe également au 450000ème.
Pourquoi dans le cas de la marche perdre de l’information (en retirant 1 à A quand C par exemple) ? Nous avons quatre variables qui n’apparaissent pas sur un graphe à 2 dimensions. Idem pour le ratio GC. Quid des deux autres ?
Regardons le Burgdorferi:burgdorferiWalk
Burgdorferi_GC
Difficile de trancher. Regardons ACGT cumulé:Burgdorferi
N’est-ce pas plus parlant ?
Par contre Synechosystis me laisse sans voix:Synechosystis
Qu’en pensez-vous ?

eleho

Bonjour,
pour compléter mon propos, j’ai tracé la différence des paires A-T et C-G.
Pour Borrelia, l’origine du point de réplication est plus visible sur ce graphe:
Borrelia_A-T_C-G
Le sommet des 2 courbes au 450000ème est confirme la méthode des ratio.
Pour Burgdorferi, le pointSynechosystis_A-T_C_G se situait aux alentour du 11000éme.
Burgdorferi_A-T_C-G
On retrouve ce pic sur la courbe C-G. Par contre le pic A-T est décalé sur droite. Est-ce un point significatif ?
Enfin, Synechosystis:
Synechosystis_A-T_C_G
Chose étonnante, les courbes sont en territoire négatif, comme s’il y avait une lecture de l’autre brin. Admettons que la lecture soit bonne, on peut remarquer un sommet au 1 750 000éme (C-G plonge, remonte à ce point et replonge). Pourrait t-on y prédire la réplication ? Alors que sur le graphe
synechosystisWalk , difficile de voir de quoi que soit.
Mais peut être que d’autre se sont intéressé d’analyser l’ADN à partir du nombre cumulé de nucléotides. Personnellement, je trouve cela plus “intéressant” que la marche ou le ratio, bien que leur complémentarité l’ait tout autant. Mais d’un point de vue algorithmique, je ne fait que des additions (cumul) et différences (A-T et C-G), bien plus rapide que des divisions.