|
|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
打开Matlab输入doc dendrogram,可以发现如下描述:" J, I' n, _7 [, ~, W# t
+ @7 d0 z# a- X0 G1 t) H
& l: y* s) [8 A/ _
5 E) y6 l2 K4 x+ [- Q5 _' c! A
- dendrogram(tree) generates a dendrogram plot of the hierarchical binary cluster tree. A dendrogram consists of many U-shaped lines that connect data points in a hierarchical tree. The height of each U represents the distance between the two data points being connected.
- If there are 30 or fewer data points in the original data set, then each leaf in the dendrogram corresponds to one data point.
- If there are more than 30 data points, then dendrogram collapses lower branches so that there are 30 leaf nodes. As a result, some leaves in the plot correspond to more than one data point.
1 G0 t5 C& \- X, @$ [$ S; D3 w
; N) @. J4 P4 J6 a/ x% c6 l8 p7 S
1 A N }: ?1 [: B+ S根据参考文献的思路,可能下面的说法更加好理解一些。
* ?$ F5 M8 L( w& T
) ^- e2 D" N6 x: u% y& ^ 在教材P301页
& D" l$ H# a" O: V* w7 x7 e0 w1)H=dendrogram(Z)2 ?9 Q l* I1 e! P0 q9 i3 z& Y
有这么一句话,“当原始数据中观测数多于30个时,整个树形图会显得比较拥挤,可能会忽略某些底层节点,也就是说此时树形图中的某个叶节点可能对应多个观测。”
+ z0 ~/ o. R# X" R" D- B, d+ Y' g 请问,可能会忽略某些底层节点是什么意思啊?某个叶节点可能对应多个观测又是什么意思呢?
# Q& ?6 X" l/ q" q# Z- V6 B 还有这里的底层节点和叶节点分别是什么意思啊?
# A; i9 J7 `; x/ s. |) [2)H=dendrogram(Z,P)
. D' d7 E" p. h8 _% y2 X% B" u- Z 若P为正整数,并且原始数据中的观测数多于P个时,将忽略某些底层节点,使得树形图的叶节点不多于P个。若P为0,则显示全部节点,此时树形图可能会显得比较拥挤。
1 O+ `* P W4 h. T/ ?' C) X. l5 V1 K
( P% e& H. G$ S' j2 T$ y1 K/ [聚类树形图上显示(注意是显示出来的)的最底层称为叶节点,当观测数目不太多时,聚类树形图能显示所有观测,此时叶节点就是各个观测;当观测过多时,聚类树形图无法显示所有观测点,也就是说某些细节会被掩盖,换句话说就是某些细小的树枝(由某些观测构成的一个小树枝)会显示为一个叶节点,此时某个叶节点可能对应多个观测。
# [3 }* l) c0 X: Y; L
1 I0 G+ j5 e O/ y! D+ {( Y3 e- p9 U+ X4 y' k1 L
* U/ c3 v; B* `+ ]6 N |
|