Archive

Définitinon ORF

ChrisHB

Bonjour,

la définition que vous utilisez de l’Open Reading Frame n’est pas conforme à sa définition biologique qui stipule qu’une ORF commence par un codon start et se termine par un codon stop.

Est-ce une erreur de votre part ou une nomenclature différente utilisée en bioinformatique ou une confusion faite en biologie entre ORF et CDS (séquence codante)?

Je viens de trouver cette référence qui peut permettre de répondre à ma question: https://www.sciencedirect.com/science/article/pii/S0168952517302299

FRechenmann

Ainsi que le confirma l’article que vous citez, il n’y a pas d’acception unique du terme ORF.

Dans ce cours, un ORF est une région propice (condition nécessaire) à la localisation d’une région codante ou CDS.

trx337

il serait intéressant de préciser les choses sur votre nombre de 20 acides aminés .
on peut lire en cherchant sur google ceci :

" Si je ne me trompe pas il y a plus de 300 acides aminés dans la nature, mais seulement 20 protéinogènes (22 dont 2 rares qui sont la sélénocystéine et la pyrrolisine). La plupart voire tous sont de la série L (contrairement aux sucres)."

les 20 acides aminés en question ne permettent que la fabrication des protéines
mais première question : les protéines de quels animaux ?
A quoi servent les 280 autres acides aminés ?
par exemple on peut se demander si certains virus n’auraient pas besoin d’un de ces 280 autres acides aminés ou si des animaux très étranges par exemple ceux découverts récement au fond de la mer vivant dans des temperatures extrêmes sont constitué par ces 20 acides aminés
comment a t on recensé ces 280 autres acides aminés
et je crois que l’on en a même décelé dans le cosmos ???

trx337

le décodage d’information crypté a toujours été une passion pour les hommes
on parle du chiffre de Jules César
plus récemment on a décodé la machine enigma pendant la guerre
on a évidement décrypté la pierre de rosette
donc la la chaîne ADN vu que l’on a du rapidement comprendre que la chaîne devaient codé les acides aminés pour fabriquer les protéines , le décodage en question a du être quand même facile vu les difficultés qu’il doit y avoir à décrypter la machine enigma ou d’autres codes informatiques ?
mais peut être je me trompe et la chaine adn est très difficile à décrypter ?
J’espère que vous comprenez ma question !!!

hfsvt

Bonjour,
La difficulté ici n’est pas tant le code lui même qui semble (a posteriori) assez simple mais sa démonstration expérimentale.
Il s’agit de le prouver et donc de dépasser le stade d’hypothèse.
1944 Preuve expérimentale de l’ADN support de l’information génétique.
1953 Description de la structure de l’ADN.
1960 Identification du premier codon UUU
1966 Fin du décryptage du code génétique.
Pour nous les choses semblent “simple” mais connaissons la réponse. Il n’en a pas été de même pour les découvreurs. Des décennies de travail !

trx337

effectivement la difficulté est que le code génétique change non seulement à chaque type d’animal mais à chaque animal . et que cela représente un nombre infini de variété contrairement à la machine enigma ou la pierre de rosette qui sont unique . En ce sens , alors oui le déchiffrage de l’adn semble impossible à comprendre . D’où ma question à laquelle personne n’a répondu : comment se fait il que l’adn code 20 acides aminés alors qu’il en existe 300 dans la nature ainsi que des milliers d’animaux différents ???

hfsvt

Non justement le code génétique est universel. C’est le même pour tous les êtres vivants.
Il y a bien quelques exceptions qui bien évidemment confirme la règle.

Par analogie, on peut dire que tous nos livres sont écrits avec le même alphabet (c’est le code) mais le message contenu est à chaque fois différent (c’est la séquence).
Ainsi l’information génétique est différente pour chacun mais le code génétique est le même pour tout le monde. Et c’est justement cette particularité qui permet le traitement algorithmique de l’information génétique pour essayer d’en tirer le sens (biologique). Ce qui est bien mis en valeur dans les différentes parties du Mooc.
Concernant la 2ème partie de la question, si personne ne peut y répondre avec certitude c’est que la question reste ouverte et que sans doute personne n’a la réponse. Avant la question il y a le constat, c’est comme cela.
Comment expliquer que le constat soit le même pour tous les êtres vivants ? Et la meilleure réponse est que la vie a une origine unique à partir de laquelle c’est développée la biodiversité et c’est la théorie de l’évolution.
Donc si seuls 20 aa sont utilisés c’est très probablement parce que c’est ce qu’était capable de faire l’ancêtre commun à tous les êtres vivants et il a transmis ces propriétés à ses descendants.
Peut-on envisager une situation différente ? Sans doute mais on ne la constate (presque) pas.

benichf1

<<Dans le monde vivant, on connaît environ 500 acides aminés, dont environ 149 sont présents dans les protéines>>:

  • donc non, il n’y a pas 300 AA mais 500
  • donc non, 149 AA peuvent former des protéines, pas 20 AA.
SebastienLaurent

22 acides aminés sont “protéinogènes”, selon votre source : ce qualificatif implique que ces derniers permettent la synthèse de protéines. Les autres acides aminés résultent de modifications dites post-traductionnelles à partir d’acides aminés protéinogènes, et n’emploient donc en aucun cas le code génétique…

vtaragano

La définition bioinformatique d’ORF m’a vraiment destabilisée. En tant que bilogiste moléculaire, j’avais tjrs utilisé comme définition celle proposée par ChrisHB

Jubilat

A mon avis, la “nature” est surtout fainéante, et très efficace. C’est à dire, que si elle a réussi a subvenir à ses besoins de “construction et fonctionnement” de la vie avec 20 AA, pourquoi en utiliser d’avantage a moins que cela lui rapporte un avantage? Peut être un peu philosophique, mais c’est la seule réponse qui me vient à l’esprit. Ceci dit, en science tout est provisoire, et donc reste à savoir si on finira par trouver des formes de vie avec des protéines construites avec d’autres AA.

jortega25