7 50 C1 GCCAACCCCA CGGTCACTCT GTTCCCGCCC TCCTGGAGCT CCAAGACAAG C2 GCTGCCCCCT CGGTCACTCT GTTCCCGCCC TCCTGGAGCT TCAAGACAAG C3 GCTGCCCCCT CGGTCACTCT GTTCCCACCC TCCTGGAGCT TCAAGACAAG C4 GAGACACCTT CATCTCCTCT GACCCCAGAG GCAGGGAGCT CCAAGACAAG C5 GCCACCCCCT TGGTCACTCT GTTC---CCC TCCTGGAGCT CCAAGACAAG C6 GCTGCCCCAT CGGTCACTCT GTTCCCGCCC TCCTGGAGCT TCAAGACAAG C7 GCTGCCCCCT CGGTCACTCT GTTCCCACCC TCCTGGAGCT TCAAGACAAG GCCACACTAG TGTGTCTGAT CAGTGACTTC TACCCGGGAG CCTTGGAAGG GCCACACTGG TGTGTCTCAT AAGTGACTTC TACCCGGGAG CCTTGGAAAG GCCACACTGG TGTGT-TCAT AAGTGACTTC TACCCGGGAG CCCTGGAAGG GCCACAATGG TGTGTCTCAT GAGTGACTTC TACCCGAGAG CCCTGGAAGA GCCATGCTGG TGTGTCTCAT AAATGACTTC TACCCAGGAG CCATAGAAGG GCCACACTGG TGTGCCTGAT CAGTGACTTC TACCCGGGAG CCCTGGAAGG GCCACACTGG TGTGTCTCGT AAGTGACTTC TACCCGGGAG CCCTGGAAGG
[olly@mplpc16 olly]$ clustalw iglc.seq -output=phylipEn sortie, le fichier iglc.phy contient les séquences alignées.
[olly@mplpc16 olly]$ dnadist dnadist: can't read infile Please enter a new filename>Ici on rentrera un nom de fichier au format PHYLIP, par exemple iglc.phy
Nucleic acid sequence Distance Matrix program, version 3.573c Settings for this run: D Distance (Kimura, Jin/Nei, ML, J-C)? Kimura 2-parameter T Transition/transversion ratio? 2.0 C One category of substitution rates? Yes L Form of distance matrix? Square M Analyze multiple data sets? No I Input sequences interleaved? Yes 0 Terminal type (IBM PC, VT52, ANSI)? ANSI 1 Print out the data at start of run No 2 Print indications of progress of run Yes Are these settings correct? (type Y or letter for one to change)Il est ici possible de changer le modèle gràce auquel seront calculées les distances en tapant D. Néanmoins le modèle "Kimura 2-parameter" fournit généralement des bons résultats sur la plupart des jeux de données. Si tous les paramètres sont correct, on tape "y" pour continuer et lancer le calcul.
[olly@mplpc16 olly]$ more outfile 7 C1 0.0000 0.0549 0.0703 0.2196 0.1673 0.0549 0.0701 C2 0.0549 0.0000 0.0286 0.2206 0.1742 0.0435 0.0507 C3 0.0703 0.0286 0.0000 0.2072 0.1834 0.0511 0.0508 C4 0.2196 0.2206 0.2072 0.0000 0.2498 0.1986 0.1975 C5 0.1673 0.1742 0.1834 0.2498 0.0000 0.1621 0.1656 C6 0.0549 0.0435 0.0511 0.1986 0.1621 0.0000 0.0587 C7 0.0701 0.0507 0.0508 0.1975 0.1656 0.0587 0.0000
[olly@mplpc16 olly]$ mv outfile distsOn lance ensuite neighbor:
[olly@mplpc16 olly]$ neighbor neighbor: can't read infile Please enter a new filename>Ici on tapera le nom du fichier contenant les distances...
Neighbor-Joining/UPGMA method version 3.5 Settings for this run: N Neighbor-joining or UPGMA tree? Neighbor-joining O Outgroup root? No, use as outgroup species 1 L Lower-triangular data matrix? No R Upper-triangular data matrix? No S Subreplicates? No J Randomize input order of species? No. Use input order M Analyze multiple data sets? No 0 Terminal type (IBM PC, VT52, ANSI)? ANSI 1 Print out the data at start of run No 2 Print indications of progress of run Yes 3 Print out tree Yes 4 Write out trees onto tree file? Yes Are these settings correct? (type Y or the letter for one to change)Normalement il n'y a rien à changer. On tape "y" pour calculer l'arbre. Cet arbre est stocké sous format Newick (non graphique) dans le fichier treefile, et sous forme plus compréhensible dans le fichier outfile.
[olly@mplpc16 olly]$ more treefile (VR-V6:0.11682,VR-V8:0.06318,((VR-V1:0.06853,(VR-V2:0.01681, VR-V4:0.03669):0.03887):0.00814,((VR-V3:0.01653,(VR-V5:0.02734, VR-V5P:0.04446):0.00437):0.03987,VR-V7:0.06190):0.01172):0.00775);
[olly@mplpc16 olly]$ drawtreeSi un fichier treefile est présent dans le répertoire, il sera automatiquement utilisé en entrée. Sinon il est demandé de spécifier un nom de fichier. Ensuite l'écran suivant s'affiche:
Which plotter or printer will the tree be drawn on? (many other brands or models are compatible with these) type: to choose one compatible with: L Apple Laserwriter (with Postscript) M MacDraw PICT format R Rayshade 3D rendering program file J Hewlett-Packard Laserjet K TeKtronix 4010 graphics terminal H Hewlett-Packard 7470 plotter D DEC ReGIS graphics (VT240 terminal) B Houston Instruments plotter E Epson MX-80 dot-matrix printer C Prowriter/Imagewriter dot-matrix printer O Okidata dot-matrix printer T Toshiba 24-pin dot-matrix printer P PC Paintbrush monochrome PCX file format X X Bitmap format F FIG 2.0 format U other: one you have inserted code for Choose one:On choisira (et tapera) "l" pour sortir un fichier Postscript.
Which type of screen will it be previewed on? type: to choose one compatible with: N will not be previewed K TeKtronix 4010 graphics terminal D DEC ReGIS graphics (VT240 terminal) U other: one you have inserted code for Choose one:Rien de particulier ici : on tape directement "n".
Here are the settings: (1) Use branch lengths: Yes (2) Angle of labels: Fixed angle of 0.0 degrees (3) Rotation of tree: 90.0 (4) Angle of arc for tree: 360.0 (5) Iterate to improve tree: Yes (6) Scale of branch length: Automatically rescaled (7) Horizontal margins: 1.73 cm (7) Vertical margins: 2.24 cm (8) Relative character height: 0.3333 (9) Enthusiasm constant: 0.11111 (10) Font : Hershey Do you want to accept these? (Yes or No) Type Y or N or the number (1-10) of the one to change:Un choix important est à effectuer ici : souhaite-t-on une répresentation avec ou sans longueurs de branches? Les longueurs de branches représentent la différence (la distance évolutive) entre espèces ou gènes. Elle apportent donc de l'information lors de la visualisation. Néanmoins si certaines de ces distances sont trop petites relativement aux autres, l'arbre obtenu peut être difficilement lisible du fait du chevauchement des noms de gènes et des branches. Donc:
[olly@mplpc16 olly]$ xpsview plotfile