Archive

Chevauchement de gènes dans la prédiction

eleho

Bonjour,
lors de la recherche de tous les gènes de Bacillus:
result
Ce résultat est faux. Par exemple les positions des gènes du 1er brin:
Phase 1: [325, 1747], [15913, 17377],…
Phase 2: [4865, 6779], [6992, 9455], [14036, 14372], [16886, 17216],…
Le 2eme gène de la phase 1 se chevauche avec le 4ème gène de la phase 2.

Ne faudrait-il pas comptabiliser uniquement ceux sans chevauchement et rajouter à 1 quand plusieurs sont en conflit ?

Au chapitre " 3.8. Des méthodes probabilistes à la rescousse", les chaînes de Markov sont utilisées pour sélectionner celui qui est le plus probable. N’existe t-il pas d’autres techniques d’apprentissage automatique comme le machine learning ou l’apprentissage profond avec réseaux de neurones qui sont utilisées ?

FRechenmann

Bonjour,

Et merci de votre contribution.

Quand vous écrivez : “Ce résultat est faux”, j’imagine que vous considérez, non pas que le programme transcrit incorrectement l’algorithme de prédiction, mais que les résultats produits par ce programme (correct donc) posent un problème de pertinence vis-à-vis de ce que l’on sait de l’organisation des génomes bactériens.

Lors de l’examen du chevauchement des régions codantes sur les 2 brins complémentaires, j’imagine que vous avez tenu compte de l’orientation de ces brins ?

Bien entendu, comme cela a été souligné plusieurs fois dans ce MOOC, les algorithmes présentés, en particulier pour la prédiction des régions codantes, sont parmi les plus simples que l’on puisse présenter. La pertinence des résultats serait sans aucun doute améliorée avec des approches plus élaborées, telle que les chaînes de Markov.

De nombreuses autres approches sont proposées dans la littérature spécialisée, et ont fait l’objet d’implémentations sous la forme de programmes efficaces, mais leur présentation dépasserait largement le cadre de ce MOOC.

François Rechenmann