|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
打开Matlab输入doc dendrogram,可以发现如下描述:, A9 D& {+ Q% I' S7 {1 |
0 g4 c6 c$ K; B [0 F6 i
4 w9 |0 F; E9 G1 m" n' D! l) A! Q- o3 j6 U% Z2 x( W
- dendrogram(tree) generates a dendrogram plot of the hierarchical binary cluster tree. A dendrogram consists of many U-shaped lines that connect data points in a hierarchical tree. The height of each U represents the distance between the two data points being connected.
- If there are 30 or fewer data points in the original data set, then each leaf in the dendrogram corresponds to one data point.
- If there are more than 30 data points, then dendrogram collapses lower branches so that there are 30 leaf nodes. As a result, some leaves in the plot correspond to more than one data point.
) K1 M' ^- @: z; h, x- l6 w ( B$ ?, ?$ l* b
% h0 _8 x% J# Q9 _根据参考文献的思路,可能下面的说法更加好理解一些。4 L' `7 P& o( X! S7 N
! H. y( t+ t" |# z
在教材P301页5 u1 X! D0 E8 B1 F l' n
1)H=dendrogram(Z)5 i$ y! ~- x2 ~& q5 ] ]8 c
有这么一句话,“当原始数据中观测数多于30个时,整个树形图会显得比较拥挤,可能会忽略某些底层节点,也就是说此时树形图中的某个叶节点可能对应多个观测。”
U5 Y, I4 W; x0 o$ ?& ~6 a3 X- @ 请问,可能会忽略某些底层节点是什么意思啊?某个叶节点可能对应多个观测又是什么意思呢?
- [9 i2 e. S! U8 X: f' U! R 还有这里的底层节点和叶节点分别是什么意思啊?
7 i3 Z# l3 X. ^- Z- `' Z- g2)H=dendrogram(Z,P)
8 m; p8 G4 u$ I3 G; H; S% P$ L; s2 G5 Q 若P为正整数,并且原始数据中的观测数多于P个时,将忽略某些底层节点,使得树形图的叶节点不多于P个。若P为0,则显示全部节点,此时树形图可能会显得比较拥挤。6 ^( ]8 S- r! t4 y/ p, o* }$ l
" m& b/ w2 r6 O7 i
聚类树形图上显示(注意是显示出来的)的最底层称为叶节点,当观测数目不太多时,聚类树形图能显示所有观测,此时叶节点就是各个观测;当观测过多时,聚类树形图无法显示所有观测点,也就是说某些细节会被掩盖,换句话说就是某些细小的树枝(由某些观测构成的一个小树枝)会显示为一个叶节点,此时某个叶节点可能对应多个观测。
( g1 d; x; A5 e* ^. v, [$ S1 A, [$ r7 r5 q; P! ?: m
* ]0 E6 y: v& n0 g
% Y4 ?2 m* O2 L* G |
|