2024年3月15日发(作者:)
系统进化树的这些知识,你都Get了吗?
系统进化树(Phylogenetic tree,又称为系统发生树/系统发育树/系统演化树/进化树
等),是用来表示物种间亲缘关系远近的树状结构图。在系统进化树中,物种按照亲缘关
系远近被安放在树状结构的不同位置,因而,进化树可以简单地表示生物的进化过程和亲
缘关系。
自达尔文时期,很多生物学家就希望用一棵树的形式描述地球上所有生命的进化历程。
早期的系统发育研究主要基于生物的表型特征,通过表型比较来研究物种之间的进化关系,
然而,利用表型特征进行系统发育分析存在很大的局限性,1965
[1]
年,Linus Pauling等
提出了分子进化理论,基于分子特性(DNA、RNA和蛋白质分子),推断物种之间的系
统发生关系,由于核苷酸和氨基酸序列中含有生物进化历史的全部信息,因此利用该方法
构建的系统进化树更为准确。
图1 系统进化树
理论上,一个DNA序列在物种形成或者基因复制时,会分成两个子序列,因而系统
进化树是一般是二叉树,由许多节点和分支构成。根据位置的不同,节点分为外部节点和
内部节点,外部节点代表最终分类,可以是物种、群体,或者DNA、RAN、蛋白质等,
内部节点表示该分支可能的祖先节点,不同节点间的连线则称为分支。
根据是否指定根节点,将系统发育树分为有根树和无根树。有根树绘制过程中需要引
入外群,因而具有一个根节点,作为树中所有物种(样本)的共同祖先节点,可以判断演
化方向,反映分类单元间的进化关系,外群与进化树中其他物种(样本)的亲缘关系不宜
太近,也不能太远,一般构建种内不同品种/亚种间的进化树,外群应选择同属内其他物种,
构建属内不同种间的进化树,外群应选择科内其他属物种。无根树绘制过程中并未引入外
群,因而没有根节点,无法判断演化方向,只能表明不同单元之间的分类关系。
图2 无根树
[2]
(左)和有根树
[3]
(右)
此外,系统进化树还可以根据分支长度是否具有意义分为标度树和非标度树。标度树
的分支长度表示变化的程度,而非标度树的分支只表示进化关系,支长无意义。
图3 非标度树
[4]
(左)和标度树
[4]
(右)
随着PCR技术及DNA测序技术的发展,系统发育树的构建从最初基于单基因序列,
发展至基于叶绿体基因组、线粒体基因组、简化基因组和全基因组,涵盖的信息越来越全
面。系统近化树构建的第一步是进行多序列比对,将不同序列中的每一个位点逐一进行比
对,构建一个矩阵来表示序列间的相似性或同源性,常用的比对软件包括MEGA、Cluster
X、DNAMAN和PHYLIP等。
将上述比对后的序列进行系统进化树的构建,主要方法包括NJ法、最大简约法、最
大似然法和贝叶斯法等。
NJ法由Masatoshi Nei
[5]
等提出,基于最小进化的原理,从所有可能的进化树中选择
进化分支长度总和最小的树,计算过程比较简单,计算速度快,适用于具有较高相似性的
物种,通常是种内水平。张献龙
[5]
等利用NJ法对352份陆地棉构建系统进化树,将其分
为3个群。
图4 基于NJ法构建的棉花系统进化树
[6]
最大简约法由 ROBERT R. SOKAL
[7]
等提出,其原理基于奥卡姆剃刀定律(解释一个
过程的最好理论是所需假设数目最少的那一个),通过对所有可能的拓扑结构进行计算,
将计算出的所需替代数最小的那个拓扑结构作为最优树,最大简约法对于分析某些特殊的
数据(如插入/缺失)较为有用。李德铢
[8]
等利用最大简约法构建了荨麻科15个形态性状
的系统进化树。
图5 基于最大简约法构建的荨麻科15个形态性状的系统进化树
[8]
最大似然法由Joseph Felsenstein
[9]
提出,其原理是根据特定的替代模型来分析一组
既定序列数据,使获得的每一个拓扑结构的似然值最大,从中选出最大似然值最大的拓扑
结构作为最优系统进化树,计算速度较慢,适用于序列相似性较低的物种,通常是种间或
亚种以上水平。匡汉晖
[10]
等利用最大似然法对240份不同园艺类型的莴苣(结球莴苣、卷
心莴苣和长叶莴苣等)构建系统进化树,所有栽培品种都形成单系分支,与野生种质显著
区分开。
图5 基于最大似然法构建的莴苣系统进化树
[10]
贝叶斯法在最大似然法的基础上,利用马尔科夫链的蒙特卡洛方法产生所有参数的后
验概率估计值,与最大似然法的区别在于,最大似然法是以观察数据的最大概率来拟合系
统树,而贝叶斯法是通过系统树对数据及进化模型的最大拟合概率得到系统树,贝叶斯法
计算速度慢,适用于序列相似性低的物种,通常是种间或亚种以上水平。Bin Tean Teh
[11]
等利用贝叶斯法构建了榴莲、可可、亚洲棉等11个物种的系统进化树,发现可可最先从
锦葵目分化出来。
图6 基于贝叶斯法构建的11个物种的系统进化树
[11]
不同方法构建的系统进化树并无好坏之分,物种间亲缘关系近时不管用哪种方法均能
得到不错的结果,亲缘关系较远时,最好是综合使用不同的构树方法,结合自己的研究内
容,选择最佳结果。通常情况下,只要选择了合适的方法和模型,构建的的进化树都是有
意义的,研究者可以根据自己的研究综合选择不同的构树方法。
参考文献
[1]Zuckerkandl E, Pauling L. Evolutionary divergence and convergence in
proteins. Evolving genes and proteins, 1965.
[2]Kim J, Hanotte O, Mwai O A, et al. The genome landscape of indigenous
African Biology,2017.
[3]Mei C, Wang H, Liao Q, et al. Genetic architecture and selection of Chinese
cattle revealed by whole genome resequencing. Molecular Biology and Evolution,
2017.
[4]Yang J, Liu D, Wang X, et al. The genome sequence of allopolyploid Brassica
juncea and analysis of differential homoeolog gene expression influencing
Genetics, 2016.
[5]Saitou N.N.M., Nei m. The Neighbor-Joining Method-a New Method for
Reconstructing Phylogenetic lar Biology and Evolution ,1987.
[6]Wang M, Tu L, Lin M, et tric subgenome selection and
cis-regulatory divergence during cotton Genetics, 2017.
[7]SOKAL R R., CAMIN J H..A METHOD FOR DEDUCING BRANCHING
SEQUENCES IN ion, 1965.
[8]Wu Z, Milne R I., Chen C, et ral State Reconstruction Reveals
Rampant Homoplasy of Diagnostic
Morphological Characters in Urticaceae, Conflicting with Current Classification
ONE, 2015.
[9]Felsenstein J. Evolutionary Trees from DNA Sequences:A Maximum
Likelihood l of Molecular Evolution, 1981.
[10]Zhang L, Su W, Tao R, et sequencing provides insights into the
evolution of lettuce and the regulation of flavonoid
Comunications, 2017.
[11]Teh B T, Lim K, Yong C H, et draft genome of tropical fruit durian
(Durio zibethinus).Nature Genetics, 2017.
发布者:admin,转转请注明出处:http://www.yc00.com/web/1710467419a1761809.html
评论列表(0条)