|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
打开Matlab输入doc dendrogram,可以发现如下描述:& M E! m8 W" \- }0 ~* |, a
# u2 ^5 f# d& E8 g% L- g
4 X! n7 o7 `- Z4 a' U. L
. _/ n+ k) p* G7 X/ a, c- dendrogram(tree) generates a dendrogram plot of the hierarchical binary cluster tree. A dendrogram consists of many U-shaped lines that connect data points in a hierarchical tree. The height of each U represents the distance between the two data points being connected.
- If there are 30 or fewer data points in the original data set, then each leaf in the dendrogram corresponds to one data point.
- If there are more than 30 data points, then dendrogram collapses lower branches so that there are 30 leaf nodes. As a result, some leaves in the plot correspond to more than one data point.9 k. q* Y5 j9 [7 k) D; D
3 A6 s4 Q) [8 }9 f# W0 @' A
' }. K5 e* w1 I& J0 r/ B9 C( z1 g
根据参考文献的思路,可能下面的说法更加好理解一些。
9 S* d8 d/ r) r! |# ?
8 H! _& \7 d) Y# {8 O& ?7 k 在教材P301页# d7 e4 s+ B3 J6 a% U
1)H=dendrogram(Z)' F6 \$ N& N! _8 q) T3 _- ^
有这么一句话,“当原始数据中观测数多于30个时,整个树形图会显得比较拥挤,可能会忽略某些底层节点,也就是说此时树形图中的某个叶节点可能对应多个观测。”
0 L- p6 m# \* ]% m2 ]. ] 请问,可能会忽略某些底层节点是什么意思啊?某个叶节点可能对应多个观测又是什么意思呢?0 Z1 x! u) N" L) Z. F
还有这里的底层节点和叶节点分别是什么意思啊?4 g- m0 n; ]" h- p$ s O
2)H=dendrogram(Z,P)
/ ?% K Z) i0 u/ S# G2 {4 S( F 若P为正整数,并且原始数据中的观测数多于P个时,将忽略某些底层节点,使得树形图的叶节点不多于P个。若P为0,则显示全部节点,此时树形图可能会显得比较拥挤。( e( ^6 x0 c( r
9 F; H( S' W) ^% w( m. V
聚类树形图上显示(注意是显示出来的)的最底层称为叶节点,当观测数目不太多时,聚类树形图能显示所有观测,此时叶节点就是各个观测;当观测过多时,聚类树形图无法显示所有观测点,也就是说某些细节会被掩盖,换句话说就是某些细小的树枝(由某些观测构成的一个小树枝)会显示为一个叶节点,此时某个叶节点可能对应多个观测。
8 w, g- }/ R; Y* S9 b* S& ?1 S# n5 G1 E; c- X) f8 C
! Z C# }8 W. q: P& ~8 r
& A( g2 T0 d7 o! E5 E/ x1 Q7 i |
|