【图文】系统进化树的构建及编辑办法
系统进化树的构建及编辑
系统发育树的构建及其后期编辑
又到了研究生写毕业论文的时候了,这几天两个师妹相继让我教他们构建系统发育树。索性就做一个图文的帖子,方便大家。纯技术贴,不涉及建树序列的选择、系统发育树如何看等理论性问题。要问的话,送一句话,自己多找几篇文章看看人家怎么分析系统发育树的。
1) FASTA 格式序列文本
FASTA是Zui为常用的序列格式,几乎所有序列分析软件都能识别这种格式的序列。构树之前先将所选的序列都粘贴在一个txt文本文件中,然后每条序列以 >开头,后面可以接序列描述性语言,比如属名,种名等。然后换行粘贴序列,序列的Zui后用空格结束,这就是一个FASTA格式的序列了。需要注意的一点是每条序列的名字的前10个字符不要完全相同。为了方便起见,Zui好将此文件放在桌面上。编辑后的序列见下图:
2) Clustal X进行多序列比对
下载此软件,解压之后直接用。解压图如下:
点击第一行Zui后一个图标,然后点击file,load sequence,选择正确路径。加载进来的序列如下图:
点击比对,进行完全比对。这时会弹出一个对话框,如下:
这时将路径改为桌面,点击对齐进行全序列比对,序列较多的话可能需要点时间。比对后的结果如下图 (注意区别):
然后注意桌面上多了两个文件,一个是dnd格式的,一个是aln格式的。Aln格式的文件将用来进行后续工作。关掉clustalX窗口即可。
3) aln 格式转化为MEG格式
打开MEGA4.0,点击file,convert to MEGA format,出现如下对话框:
选择路径,将aln格式文档加载进来,点击OK,出现下图:
点击保存,会发现在桌面上又多了一个文档,看其属性会发现是MEG格式的,OK。
4) MEG文档的激活
关掉这些窗口,回到MEGA刚打开时的样子,将刚生成的那个MEG文档用拖拽的方式拖进MEGA4.0,这时会出现如下对话框:
废话一句:核酸序列比对选核酸序列,氨基酸序列比对选氨基酸序列。点击OK,出现如下:
关掉这个界面,此时该MEG文档已被激活,处于待用状态,如下 (可以和MEGA初始界面做下对比):
5) 开始建树(NJ tree)
原理不讲了,此处以构建NJ树为例。点击工具栏上的phylogeny,construct phylogeny,neighbor joining (NJ).出现如下界面(注意几个绿颜色的小方块):
点击第一个小绿方块,选择,小绿方块会变成四个点的省略号,再点击出现如下页面:
选择Bootstrap,后面的replication改为1000,点击对勾。然后点击第三个小绿方块,这个时候对于蛋白质序列以及DNA序列,两者模型的选择是不同的。对于蛋白质的序列,多选择Poisson Correction (泊松修正)这一模型。而对于核酸序列,多选择Kimura 2-parameter (Kimura-2参数) 模型。所有设置完毕之后,点击compute,雏形的树就出来了:
可以对此树做出一些修改,比如线条粗细,树的形状等等,此处自己多试试。
6)树的修饰
建好树之后,往往需要对树做一些美化。这个工作完全可以在word中完成,达到发表文章的要求。点击image,copy to clipboard。新建一个word文档,选择粘贴。见下图:
在图上点击右键,就可以对文字的字体大小,倾斜等做出修饰。见下图:
这个时候可以通过Adobe professional 对其进行图像导出:先将此word文档打印成PDF,见下图:
将打印出来的PDF保存在桌面上,打开,如下图:
此时,点击 工具,高级编辑工具,裁剪工具,如下图所示:
选择需要的区域以删除周围的空白区,双击发育树,会出现下图:
点击确定,出现下图 (把空边切掉了):
点击文件,另存为,在保存类型一栏中选择 TIFF格式,点击确定后会生成下面这个图片,所生成图片绝对可以满足文章的发表:
OK,结束了,自己玩一把吧。
好像有点小遗漏,对齐后的序列要把两端截成一样齐的,你的那个对齐的aln文件,前面有的长有的短,你好像没有写要把首尾截成一样长……
建成的树,MEGA里面也可以修改,还可以改变枝的颜色,调整两个枝的上下顺序等……:
我刚才测试了一下,好像是可以加入一些希腊字母的,不过好像是字体的差异,字体改行不好,呵呵,不过,我一般是用MEGA来改一些Line的Width和颜色,再在画图板里面改,个人爱好呵呵!
NJ树是采用距离罚分的吧,如果没有一样长的话,不是无形之中就加大了两个树之间的距离了吗?我觉得还是应该截一下吧。。
这个并非本贴所要讨论的,要讨论估计又可以码一个帖子了。
线条粗细我也是在MEGA中调的,线条颜色没改动过,字体我都是在word中完成的。一篇文章中还画了椭圆,也是在word中实现的。
正在画树,很实用!!
好像有点小遗漏,对齐后的序列要把两端截成一样齐的,你的那个对齐的aln文件,前面有的长有的短,你好像没有写要把首尾截成一样长……
建成的树,MEGA里面也可以修改,还可以改变枝的颜色,调整两个枝的上下顺序 ...
这才像做个进化树的人,做进化树,选择的序列也需模式菌种,才有说服力
此贴纯技术贴,不讨论其他。。
谢谢分享,我一直想总结,就是没动手。
讲解的很清楚,谢谢,不用发愁了,呵呵,真是感谢
很好,很强大,有天我也能发这么个帖子帮人就美好了
弱弱出个声儿,mega4.0中不是嵌合了Clustal了么,为什么我们还要下载一个ClustalX呢?
有更简单的方法出现?介绍下啊
导入序列,比对,通过选择NJ算法就直接出结果了。
需要采用gema5建树的,请留下邮箱。
您这个教程里clustaiX的作用是什么呢?
首尾截断我在前面已经提过了,不是必须的。