Rechercher des séquences

Sur le site NCBI (National Center for Biotechnology Information) par exemple, on pourra trouver la séquence d'une protéine ou d'un acide nucléique pour des espèces différentes.
Dans l'exemple de la FSH, il faut rechercher successivement les deux sous-unités dans la catégorie "proteins" en tapant, dans le rectangle du moteur de recherche, follicle stimulating hormone beta subunit et follicle stimulating hormone alpha subunit.
De nombreuses molécules de mammifères sont disponibles sous la forme de précurseur, de longueur un peu plus importante que la chaîne de l'hormone.

Afin de rechercher l'évolution de la molécule entière, il faut sélectionner les espèces pour lesquelles on dispose des séquences des deux sous-unités. Huit espèces ont été sélectionnées dont Trichosurus vulpecula, le phalanger-renard qui est un marsupial.

Afin de formater rapidement ces données pour les ouvrir dans Anagène, télécharger au préalable le modèle clear_ncbi.dot (clic droit : enregistrer sous...). Placer ce modèle pour Word 97 dans le sous dossier Modèles de Microsoft Office se trouvant dans Program Files.
Ouvrir un document à partir de ce modèle en choisissant Fichier puis Nouveau, sélectionner clear_ncbi.dot.

La séquence originale disponible sur le site ncbi se présente sous la forme suivante :

1 mdyyrkyaai flvtlsvflh vlhsapdvqd cpectlqenp ffsqpgapil qcmgccfsra
61 yptplrskkt mlvqknvtse stccvaksyn rvtvmggfkv enhtachcst cyyhks

La macro du modèle va enlever tous les chiffres, tous les espaces et mettre les lettres en majuscule.
Pour chacune des espèces, la séquence sera copiée sur le site NCBI et collée dans le document "clear_ncbi". Toutes les séquences peuvent être copiées avant d'exécuter la macro, elles seront séparées par une ligne afin de les retrouver sans erreur.
Pour le traitement des données dans Anagène, ne pas dépasser 10 molécules, l'alignement avec discontinuités ne pourrait pas se faire.
Exécuter la macro contenue dans le document en ouvrant Outils puis Macro... et Macros, choisir clear_ncbi et Exécuter.