MEGA 6.06的简易使用指南
第一步:打开软件
下面介绍菜单的使用:
Data菜单:
Creat a new :创建一个新的数据比对文件,也就是说当我们比对完一组后,想接着
比对另一组,那么使用它就可以不用退出直接把数据文件导入;
Open :打开先前已经比对并保存好的文件,它包含两个子菜单: retive sequence
from file 和saved aligment session ;
Close: 关闭当前的比对数据文件;
MEGA 6.06的简易使用指南
Save session :保存当前比对结果,可以给比对的结果一个文件名;
Export alignment :将当前的序列比对结果输出到指定文件,有两种输入格式可供选
择:MGTA 和FASTA.
DNA sequence :使用它来选择输入的数据 DNA 序列,这里需要说明的是如果你输入的
数据是氨基酸序列的话,比对窗口只显示一个标签,若是 DNA 序列的话则显示两个标
签,一个是 DNA 序列的,另一个是氨基酸序列的。
Protein sequences :选择输入的氨基酸序列,选择后,所以的位点就被当作氨基酸残
基位点来对待。
Translate/untranslate :只有比对的序列是编码蛋白的 DNA序列的时候才可用。它可以
根据指定的遗传密码表将 DNA 序列翻译成特定的氨基酸序列。
Select genetic code table :使用它将编码蛋白的 DNA 翻译成特定的蛋白序列。
R everse complement :将选择的一整行的 DNA 序列变为与之互补配对碱基序列。
Exit alignment explorer :退出序列比对的资源管理窗口
Edit 菜单:
使用这个菜单可以对我们的比对序列进行想要的一些编辑工作具体为
Undo:撤销上一步操作;
Copy:复制;Cut:剪切; Paste:粘贴;这三个操作都可以只针对一个碱基或
氨基酸残基也可以是一段甚至是整个序列;
Delete:从比对表格中删除一段序列;
Delete gaps:去掉序列中的空缺;
Insert blank sequence:重新插入一空行;标签和序列都是空的;
Insert sequence from file :从已保存的文件中插入新的序列;
MEGA 6.06的简易使用指南
Select sites :选择
一列序列,与点击比对表上方的灰白空格作用类似;
Select sequence:选择一行序列,与点击比对表格左侧的标签名作用类似;
Select all:全选;
Allow base editing :只读保护,只有选择后才能对序列进行编辑操作,否则
所以的序列为只读格式,不能进行任何编辑操作。
Search 菜单:
用来快捷查找序列中的标记未定或者目的碱基或残基。
Find motif :输入你想要查看的一小段序列。找到后会以黄色标出;
Find next :在序列的下游查找目的序列片段;
Find preious :在序列的上有查找目的序列片段;
Find marked sites :查找标记位点;
Highlight motif :突出标记已经选择的位点。
Web 菜单:
这个菜单提供一个链接 Genbank 的入口,可以在网上直接做 Blast 搜索。当
手上没有准备好要比对的序列时,可以直接去网上搜索。
Query gene banks :开启 NCBI 的主页;
Do blast search: 开启NCBI BLAST 主页;
Show browser :开启网页浏览器。
Sequencer 菜单:
此菜单下只有一个子菜单: edit sequencer file ,用来打开一个打开文件对话
框,此对话框可以打开一个 sequencer data file ,一旦打开,这个文件就在 trace
MEGA 6.06的简易使用指南
data file viewer/editor 的对话框中展示出来。这个编辑窗口允许你查看和编辑
automatd DNA sequencer 产生的trace data 。它可以阅读和编辑 ABI 和Staden 格式
文件并且序列可以直接被导入到序列比对窗口或被上传到网页浏览器做 blast 搜
索。
Display 菜单:
这个菜单相对简单,主要用来调整工具栏。
Toolbars :工具栏菜单,它包含一些子菜单,选择后就会出现在比对的窗口
中;
Use colors :将不同的位点以不同的颜色显示;
Background color :选择后位点的显示与位点一样的背景颜色;
Font :字体对话框,通过选择来调整窗口中的序列字符的大小。
Alignment 菜单
Mark/unmark site:在比对的表格中标记或者不标记一个单一位点,一次每
条序列只能被标记一个位点,不同序列间的位点你可以选择同一列的,也
可以是错开的,要根据自己的目的进行选择。选择标记后的序列可以使用
alignmarked sites 进行比对分析。
Align marked sites: 比对标记的序列,在这里如果在两个或多个序列间标
记了不在一列的位点重新比对后会出现空格 。
Unmarked all sites :把所以标记的位点去标记;
Delete gap-only site :去掉序同是空格的一列;这在多序列比对前很有用。
Auto-fill gaps :使用空格补齐不同长度的序列。
MEGA 6.06的简易使用指南
建树:
1) 下载数据
MEGA 6.06的简易使用指南
MEGA 6.06的简易使用指南
2) 初步聚类:
MEGA 6.06的简易使用指南
MEGA 6.06的简易使用指南
MEGA 6.06的简易使用指南
3) 建树
MEGA 6.06的简易使用指南
MEGA 6.06的简易使用指南
MEGA 6.06的简易使用指南
进化树的构建另一种方式:MEGA软件构建系统发育树
摘要 :以白色念珠菌属下面的十个种的18s RNA 为例,构建系统发育树来说明MEGA软件的使
用方法。
1背景简介
1.1 MEGA(分子进化遗传分析)
MEGA 的全称是Molecular Evolutionary Genetics Analysis。MEGA is an integrated tool for automatic and manual sequence alignment, inferring phylogenetic trees, mining web-based databases, estimating rates of molecular evolution, and testing
evolutionary
MEGA 6.06的简易使用指南
hypotheses. MEGA 可用于序列比对、进化树的推断、估计分子进化速度、验证进化假说等。MEGA 还可以通过网络(NCBI)进行序列的比对和数据的搜索。
最新版本:MEGA 5.1 Beta (软件开发者建议其结果不用于发表文章)
建议下载版本:MEGA 5.05 for Windows and Mac OS。
MEGA 5 has been tested on the following Microsoft Windows® operating systems: Windows 95/98, NT, 2000, XP, Vista, version 7, Linux and Mac OS [1].
MEGA 5.05 可免费下载,只需输入名字及有效邮箱,下载链接会发送至邮箱,点击可下载。
1.2 系统发育树定义
系统发育树(英文:Phylogenetic tree)又称为演化树(evolutionary tree),是表明被认为具有共同祖先的各物种间演化关系的树。是一种亲缘分支分类方法(cladogram)。在树中,每个节点代表其各分支的最近共同祖先,而节点间的线段长度对应演化距离(如估计的演化时间)
1.3 系统发育树的分类 根据有根和无根来区分:树可分为有根树和无根树两类。有根树是具有方向的树, 根据系统发生树可推断出物种的起源包含唯一的节点,将其作为树中所有物种的最近共同祖先。最常用的确定树根的方法是使用一个或多个无可争议的同源物种作为外群(英文outgroup),这个外群要足够近,以提供足够的信息,但又不能太近以至于和树中的种类相混。把有根树去掉根即成为无根树。一棵无根树在没有其他信息(外群)或假设(如假设最大枝长为根)时不能确定其树根。无根树是没有方向的,其中线段的两个演化方向都有可能。
基于单个同源基因差异构建的系统发生数应称之为基因树。因为这种树代表的仅仅是单个基因的进化历史。而不是它所在物种的进化历史。物种树一般最好是从多个基因数据的分析中得到。例如一项关于植物进化的研究中,用了100个不同的基因来构建物种树,因为进化是发生在生物体种群水平上的,而不是发生在个体水平上的,虽然表面上不需要更多的数据,但实际上还是有必要的。基因树和物种树之间的差异是很重要的,如果只用等位基因来构建物种数,那许多人人和大猩猩就会分到一起,而不是和其他人分到一起。
1.4 构建方法
要构建一个进化树(phyligenetic tree)。构建进化树的算法主 要分为两类:独立元素法(discrete character methods)和距离依靠法(distance methods)。所谓独立
MEGA 6.06的简易使用指南
元素法是指进化树的拓扑形状是由序列上的每个状态决定的,而距离依靠法是指进化树的拓扑形状由两两序列的进化距离决定的。进化树枝条的长度代表着进化距离。独立元素法包括最大简约性法(Maximum Parsimony methods)和最大可能性法(Maximum Likelihood methods);距离依靠法包括除权配对法(UPGMAM)和邻位相连法(Neighbor-joining)。
2 蛋白质序列分析使用方法
2.1 打开网址http://www.ncbi.nlm.nih.gov/protein/,将菌名输入到protein后面的框内,点Search键,选择一个搜索结果点击进入
2.2 将搜索出来的结果选择send to下拉箭头内的选项,
Analysis Tool
和BLAST,选择好后点击Submit进行搜索
MEGA 6.06的简易使用指南
2.3
进入BLAST页面,点击页面最下面的BLAST按钮,进行blast ,如图所示:
2.4 从结果中选择10个蛋白质序列,进行复制,粘贴到TXT文档内,然后将TXT文档后缀名改为FASTA