Intégration des séquences dans ANAGENE

Ouvrez d'abord le fichier ent ou pdb dans un traitement de texte comme Word. Outre les caractéristiques de la molécule et de nombreuses remarques, on trouve la séquence des acides aminés sous la forme par exemple :

SEQRES 1 A 386 ALA GLY SER ILE GLY ALA ALA SER MET GLU PHE CYS PHE 1OVA 100
SEQRES 2 A 386 ASP VAL PHE LYS GLU LEU LYS VAL HIS HIS ALA ASN GLU 1OVA 101
SEQRES 3 A 386 ASN ILE PHE TYR CYS PRO ILE ALA ILE MET SER ALA LEU 1OVA 102
etc.

Pour que le fichier soit reconnu par ANAGENE comme une protéine qui puisse être comparée à d'autres, il faut qu'il ne contienne que le code des acides aminés à une lettre et sans espace. Il faut donc convertir le code 3 lettres en code une lettre. Pour cela, il est plus simple d'employer une macro comme celle qui est téléchargeable sous la forme d'un modèle AA3.dot pour Word 97.
Cette macro est incorporée à un modèle de Word 97, vous devez copier ce fichier dans le sous répertoire Modèles de Microsoft Office se trouvant dans Program Files.
Pour l'utiliser, dans Word choisissez Fichier puis Nouveau et sélectionnez AA3.dot, c'est dans cette nouvelle page que vous copierez les acides aminés correspondants à la séquence de la protéine du fichier .ent ou .pdb.
Pour exécuter la macro, ouvrez Outils puis Macro... et Macros, choisissez AA3 et Exécuter.
La macro va, non seulement transformer le code 3 lettres des acides aminés en code 1 lettre, mais supprimer également les espaces, le mot SEQRES et tous les chiffres.
Un problème peut cependant subsister. Si la molécule est exprimée sous la forme présentée ci-dessus, la macro laissera, à la fin de chaque ligne, des lettres correspondant au nom de la molécule, par exemple, dans le cas présenté ici, les lettres OVA. Il faudra donc les enlever manuellement si elles existent. Il est donc prudent de repérer ces lettres avant d'exécuter la macro pour ne pas commettre d'erreur ensuite.
Astuce : en tenant la touche ALT enfoncée, la sélection à copier peut se faire en éliminant les parties latérales des lignes.
Les passages à la ligne ne perturbent pas Anagène mais ils peuvent être aussi enlevés à la main afin de rendre le fichier plus compact.

Enregistrez alors votre fichier au format texte (txt), de préférence dans le sous répertoire Sauve du répertoire Anagene. Allez ensuite dans l'explorateur, modifiez l'extension en remplaçant .txt par .pro et acceptez cette modification malgré la fenêtre d'alerte.

Pour incorporer ce fichier dans ANAGENE, choisissez Fichier Ouvrir, sélectionnez le fichier .pro et répondez oui à la question "Voulez-vous l'ouvrir comme fichier de séquence ?"
Cliquez sur OK et vous avez une nouvelle séquence.

Vous pouvez alors enregistrer cette protéine dans la banque de séquences personnelles. La séquence étant à l'écran, dans Fichier choisissez Enregistrer puis cliquez sur le bouton Banque de séquences et OK. Il faut commencer par ajouter un utilisateur qui contiendra les différentes séquences enregistrées individuellement.

Si vous voulez enregistrer plusieurs séquences dans la même fenêtre, après avoir ouvert comme précédemment chacune des séquences, dans Fichier choisissez Enregistrer puis cliquez sur le bouton Thèmes d'étude, donnez un nom d'utilisateur et un nom de thème.

Une autre solution est d'enregistrer un fichier texte avec l'extension .edi. La syntaxe de ces fichiers est très précise et toute faute empêchera l'ouverture du fichier par Anagène. Un fichier modèle est disponible, si vous désirez le voir faites un clic gauche sur le lien, si vous désirez l'enregistrer faites un clic droit. Si le fichier téléchargé est enregistré avec une double extension .edi.txt, supprimez l'extension .txt. Les instructions sont contenues dans le fichier, il suffit de remplacer les exemples par vos propres séquences, de copier ces mêmes exemples pour ajouter des séquences, de supprimer ceux qui sont inutiles.

Dernière mise à jour le Jeudi 16 janvier 2003 12:06:50