newick格式的tree文件

基于遗传距离构建进化树的过程中,会先得到不用样本之间的遗传遗传距离,然后构建进化树,但在tree文件中是以表示分枝长度来解释leaf nodes之间的关系。

Newick文件中,描述的是各节点的枝长度,枝节点包括 leaf nodes 和internal nodes。但不显示internal nodes 节点名称,显示leaf nodes节点名称。
在建树时,不同样本之间的遗传距离为以下:

遗传距离

遗传距离构建的进化树如下
聚类树

在聚类树图中,显示的sd和ah 两leaf nodes 之间的遗传距离为两节点长度相加即 0.0093+0.0302 = 0.0395 与遗传距离表中两个样本之间的数据0.0395相同。
而当从聚类树种计算xz和ah节点之间距离时
image.png
,其结果与表中两样本之间遗传距离0.3719的数据不同。可能是由于根据遗传距离做进化树时的一种策略,造成数据不相等。

在聚类文件中,表述在遗传距离x处可分为几类是如何测定的不是很清楚。

你可能感兴趣的:(newick格式的tree文件)