les dossiers de l’ afis44
DOSSIER : GENETIQUE
sujet : génétique et
biotechnologies
emprunté au cours de 1er cycle de
rubrique : le cours de
biologie de Gilles Bourbonnais
document : l’ADN et le code génétique
L'information génétique
Comme nous
l'avons vu au chapitre deux, les protéines sont de grosses molécules formées de
l'union de molécules plus petites, les acides aminés. Chaque
protéine est caractérisée par le nombre d'acides aminés qu'elle renferme et
l'ordre dans lequel ils sont enchaînés (la séquence).
Le lysozyme,
par exemple, est formé de 126 acides aminés enchaînés les uns aux autres dans un
ordre bien précis. Le premier de ces acides aminés est la lysine (lys),
le second, la valine (val), le troisième, la phénylalanine (phe)
et ainsi de suite jusqu'au 126ième et dernier acide aminé de la chaîne qui est
la leucine (leu). Chaque fois qu'une cellule fabrique une molécule de
lysozyme, elle doit assembler ces 126 acides aminés dans l'ordre bien
précis caractéristique de cette protéine.
On sait
aujourd'hui que la "recette" du lysozyme, l'information correspondant
à l'ordre d'assemblage des acides aminés de cette protéine, est présente sous
forme d'ADN dans le noyau de la cellule. L'ADN constitue pour la cellule un
gigantesque livre de recette comportant toutes les recettes de protéines que la
cellule peut fabriquer.
Comme nous
l'avons également vu, l'ADN est une énorme molécule formée de l'union les
unes aux autres de centaines de milliers de molécules plus petites appelées nucléotides. Il y a
dans l'ADN quatre sortes de nucléotides que l'on désigne respectivement par les lettres A, T, C et G. Mais
comment une longue succession de nucléotides peut-elle constituer une
"recette" une information précisant l'ordre d'assemblage d'acides
aminés ?
Le code secret de la vie
Imaginez que
vous possédiez un grand nombre de billes de plastique que vous pouvez enfiler
sur un fil comme les perles d’un collier. Ces billes sont de quatre couleurs
différentes: bleues, rouges, vertes et jaunes. Seriez-vous capable de rédiger
un message secret avec ces billes enfilées sur un fil?
On pourrait assigner à chaque bille une lettre de
l’alphabet. La bille jaune correspondrait, par exemple, à la lettre A, la verte à B, la bleue à C et la rouge à D. Vous
voyez le problème? Notre message à coder ne pourrait avoir d’autres lettres que
ces quatre là. On pourrait, par exemple, écrire "DADA" (rouge - jaune - rouge - jaune),
"BABA" ou "BAC" mais pas "BIOLOGIE" puisque notre
code n’a pas les lettres I, O, L et G.
Représentons plutôt chaque lettre par deux billes.
Par exemple: bleue
- rouge
correspondrait à "A", jaune - verte à "B", bleue - bleue à "C" et ainsi de
suite.
"BABA"
s’écrirait alors:
C'est déjà mieux, on a maintenant 16 combinaisons possibles.
Malheureusement, ce n'est pas assez puisque l'alphabet comporte 26
lettres.
Regroupons alors les billes par trois. Par exemple,
décidons que les trois billes " jaune - bleue - rouge " représentent la lettre "A",
" bleue
- jaune
- verte
" la lettre "B", " jaune - rouge - rouge " la
lettre "C" et ainsi de suite jusqu'à "Z". Avec des
combinaisons de trois billes, on peut former 64 combinaisons différentes, c’est
plus que ce qui est nécessaire pour coder 26 lettres.
On pourrait
ainsi rédiger un message en enfilant des billes de couleur sur un fil. « BABA » s’écrirait en enfilant dans l’ordre, les
billes:
Quiconque
connaît le code utilisé pourrait lire le message en regardant la succession des
billes de couleur formant le chapelet. Sauriez-vous, avec ce code, écrire « BAC
»?
Plutôt
qu’utiliser des billes, utilisons quelque chose de beaucoup, beaucoup plus
petit, des nucléotides. Il y a quatre sortes de
nucléotides, A, T, C et G. Lions ces nucléotides
les uns aux autres comme les perles d’un chapelet. On pourrait imaginer un code
où chaque groupe de trois nucléotides correspondrait non pas à une lettre de l’alphabet
(la cellule n’a que faire de l’alphabet romain) mais à
un des 20 acides aminés formant les protéines. On pourrait ainsi former
des messages correspondant à la recette d’une protéine.
Convenons,
par exemple, que les trois nucléotides A-A-A représentent l’acide aminé phénylalanine, G-A-C représentent la leucine, T-C-T l’arginine
et ainsi de suite.La protéine formée des cinq acides aminés Phé-Arg-Leu-Phé-Leu pourrait être représentée
(codée) par la chaîne formée des nucléotides:
On aurait ainsi
une molécule (un polymère de nucléotides) qui représenterait, sous forme
codée, la recette d’une protéine. On pourrait aussi mettre « bout à bout
», des milliers de recettes différentes. Eh bien, un chromosome, c’est
exactement ça!
Imaginez
chaque chromosome comme une longue, une très longue succession de nucléotides,
un chapelet formé de centaines de millions de perles. Chaque groupe successif
de trois nucléotides correspond à un acide aminé selon un code préétabli connu
par les cellules.
Si vous avez lu le texte sur la structure détaillée de l'ADN, vous savez déjà que cette molécule est formée de deux
chaînes de nucléotides. En fait, le message correspondant aux recettes des
protéines, n’est porté que par une de ces deux chaînes, l’autre ne sert qu’à
stabiliser la molécule (elle permet aussi à la molécule de se reproduire). La
cellule, plus précisément les enzymes responsables de la lecture du message,
savent reconnaître quelle chaîne porte le message.
La quantité d’information contenue dans les 46 chromosomes
d’une cellule humaine correspond à peu près à l’information contenue dans une
encyclopédie de 1000 volumes de 1000 pages chacun. Cette information est
contenue dans un volume équivalent environ à un millième du volume d’une tête
d’épingle, le volume du noyau cellulaire.
Pour lire le
message, il faut évidemment connaître le code. Ce code, qu’on appelle le « code génétique », a été découvert au début des années
60. Allez y jeter un coup d'oeil.
Dans le cas
du code à trois billes de couleur, c’est moi qui avais décidé du code. Par
exemple, j’avais établi, de façon tout à fait arbitraire, que JBR (jaune-bleu-rouge)
correspondait à la lettre A. J’aurais pu tout aussi bien utiliser une autre
combinaison. Mais dans le cas du code génétique, qui a décidé que les trois
nucléotides AAT correspondaient à l’acide aminé leucine? Nul ne peut répondre à
cette question. On imagine que le code s’est formé au tout début de l’histoire
de la vie, il y a plus de trois milliards d’années. Mais on ne peut absolument
pas expliquer pourquoi c’est ce code (celui ci-dessus) qui a été retenu par la
nature. Si la vie existe ailleurs dans l’univers, on ne sait pas si elle est
basée, comme la nôtre, sur une information génétique faite d’ADN et, si c’est
le cas, si le code est le même que le nôtre.
D’ailleurs, le code n’est pas aussi universel que je le mentionnais. Certains animaux unicellulaires possèdent un code légèrement différent de celui des autres cellules (ils n’ont qu’un triplet indiquant STOP, les deux autres correspondent à un acide aminé). Il en est de même pour les mitochondries, celles-ci possèdent leur propre ADN et fabriquent leurs propres protéines. Or, on a découvert, il y a quelques années, que le code utilisé par les mitochondries des mammifères n’est pas le même que celui utilisé dans le noyau de la cellule (il y a trois groupes de trois nucléotides qui codent pour un acide aminé autre que celui du code ci-dessus).
d’après le cours
de Gilles
Bourdonnais
(avec son aimable autorisation)
afis, Science et pseudo-sciences, 14 rue de l'école polytechnique, 75005 PARIS.