找回密码
 注册
关于网站域名变更的通知
查看: 1017|回复: 1
打印 上一主题 下一主题

已知信源符号为英文字母(不区分大小写)和空格输出,计算自信息量的信源熵值

[复制链接]

该用户从未签到

跳转到指定楼层
1#
发表于 2019-12-9 10:28 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您登录!

您需要 登录 才可以下载或查看,没有帐号?注册

x
本帖最后由 uperrua 于 2019-12-9 10:45 编辑 ; z: C7 D5 m3 u7 ~
$ d5 O( ]: _& k3 h! q7 `$ H
已知信源符号为英文字母(不区分大小写)和空格输出,计算自信息量的信源熵值
! E" S' ]3 r$ R# L( z! |+ |' y2 M9 l" Z5 d
信源熵值的计算
. |& ]; Z0 M. B2 e
' Z* r& ?, u/ M! k" ]5 N/ D2 |一、实验目的
6 m) C: f% m9 o% E- g3 W; ]1 进一步熟悉信源熵值的计算. K' G3 J$ r4 n# b. O4 C; A4 J& t
2 熟悉 Matlab 编程
1 Z3 F0 D5 W# N

! Q+ @- M, E# Q! `) C5 \- g二、实验原理" Z! f6 p+ V& d# a9 A
熵(平均自信息)的计算公式( S2 D9 b% @  g" L$ ~
  s2 j' U! y5 H0 T' S. n) C9 J" X

3 R6 x2 I. X/ V) M+ NMATLAB实现: ;或者:
. M/ ?+ X3 m0 q' q9 O流程:第一步:打开一个名为“ nan311”的 TXT文档,读入一篇英文文章存入一个数组 temp,为了程序准确性将所读内容转存到另一个数组 S,计算该数组中每个字母与空格的出现次数 ( 遇到小写字母都将其转化为大写字母进行计数 ) ,每出现一次该字符的计数器 +1;4 S5 v8 ^, Z0 T: M2 q$ v& d
第二步:计算信源总大小计算出每个字母和空格出现的概率;  _. [7 I4 n4 n* j+ \1 S
最后,通过统计数据和信息熵公式计算出所求信源熵值(本程序中单位为奈特nat )。

3 ]7 z+ x- g8 R. i2 C! z# s
( ?) D+ f1 b' ?( G) V% g" @" J程序流程图:
4 y& M3 v! p+ q4 d. G! o# @
1 G5 x% s/ h0 G2 v7 F( \) ~

- K$ C) O3 q8 f3 `1 `( ~三、实验内容; ^6 n1 T/ z$ P9 _' {3 d
1、写出计算自信息量的 Matlab 程序
- ~# W% a  _0 A5 o7 Y2、已知:信源符号为英文字母(不区分大小写)和空格。
2 K5 y, X- O# u! {输入:一篇英文的信源文档。
* n( A# m1 {# m% |: y2 V& a' H输出:给出该信源文档的中各个字母与空格的概率分布,以及该信源的熵。
1 h3 W, Y0 ~0 e* l* A- A- z3 t
. s5 L4 G' g) M5 s5 _: p. f, S
四、实验环境
- e" g0 u0 W$ d" W8 J6 qMicrosoft Windows 7 . t$ W& [6 M( t0 _" v5 w
Matlab 6.5
6 [" b- P3 i0 R
. D" l; Q1 D+ x# \' l
五、编码程序
8 \' s1 u7 e4 K: |#include"stdio.h"
( Z! p, X- O7 ?2 l#include <math.h>
- M5 J  C: t6 l; W* M#include <string.h> - h( p1 G1 J( t9 i
#define N 1000
( b) O  `" A$ j8 d. bint main(void) # d" w$ L5 o" `
{ 1 ~% A2 F" k3 i' L+ _  ~  L
char s[N];
4 X8 \4 y$ @7 q! p# v- Pint i,n=0;
& r7 ?6 S) V  p& Y& N* ffloat num[27]={0};
5 Z' D, W! C7 u8 p/ X4 Ndouble result=0,p[27]={0};
  \! m. z( t6 H( ~5 WFILE *f;
, K1 @" F# w9 o; }char *temp=new char[485];
" F' p# }% {# \. e0 g8 L  d( lf=fopen("nan311.txt","r");
, R# z! @2 Q) ewhile (!feof(f)) { ' t6 }1 L4 r' T% Q7 B8 _- t
fread(temp,1, 486, f);} 8 S8 d$ G1 b- i% Y6 t
fclose(f);
& G6 @1 R0 N+ R( x5 u9 C. L9 P9 t. {s[0]=*temp;
  b- ]3 O" S) ]6 ~' `: x; k5 g2 [for(i=0;i<strlen(temp);i++)
* n7 S. h3 ~7 t) E0 T- o3 D  t7 i{
6 d5 c/ u/ a( [" }. t0 as=temp; " S0 F  D- l  _9 |
} + }4 g2 w. O" p; k5 ?2 d
for(i=0;i<strlen(s);i++) / E4 j0 K' F/ B, y
{ 0 |# V# J% }2 T$ H. K/ q
if(s==' ') - \  d# I7 e1 B3 L. D/ b
num[26]++; + q* v# D8 }% W. F
else if(s>='a'&&s<='z')
! A; s  @5 d$ o1 {1 znum[s-97]++; # W% v8 x3 e5 z3 x3 H
else if(s>='A'&&s<='Z')
% S  }* D$ a  Z4 B: ~num[s-65]++;
9 H5 z# a8 q1 Q* w) [7 e, I' L* `} + w0 t0 i4 |5 a8 d6 C
printf(" 文档中各个字母出现的频率 :\n");
6 t9 X" P* u5 R! x9 {for(i=0;i<26;i++)
4 _* ^$ D* {" A{
8 \5 g7 `+ M2 ~' k4 {p=num/strlen(s);
5 ^, P& b6 T# Q7 wprintf("%3c:%f\t",i+65,p); 3 F# y( d! @& z# n8 z& B8 S- x9 K
n++; 1 ]# k& f+ z( m6 ?" w
if(n==3)
) G% {2 v% [. {5 ^8 @- M{ , |. A' F6 U- Z5 i
printf("\n");   s. P/ d$ w1 J% I: O
n=0;
5 \; p1 c5 {' @0 L8 {% O& L} $ k  L( A# a. |' \4 O. ^( h2 E
} 1 E& I; H  _7 M" d
p[26]=num[26]/strlen(s); 9 I) n* y$ s: m; G1 }7 ?# o3 }1 Z
printf(" 空格:%f\t",p[26]); $ v- u; P/ v9 ?( A- m( p
printf("\n"); ) g1 k  _& t) t, j
for(i=0;i<27;i++)   p: l6 k5 w# c- H
{
5 x( U5 e. {6 m6 w3 u  h: [if (p!=0) , p2 s6 u5 B3 X
result=result+p*log(p); ' l, {; G  ~3 O# y
}
$ B1 u1 N6 [- a0 ?result=-result;
' @) M* l6 r! `) [& i% s! u2 Fprintf(" 信息熵为 :%f",result); ; e/ N$ Y9 o6 {: k+ [1 v  K: t
printf("\n");
5 m! O' D% @/ \, f& H( a$ ?return 0;
. ^. P' n2 ~% n" L9 C3 N2 c} ) d/ ]9 c2 J1 O2 Y& @

. u( v3 Q7 Z( b5 `六、求解结果+ K( O1 `* B/ {( M; `7 d( s
& B8 k5 {% Q4 q# K) e
( |" C+ Y1 N3 W9 V$ D
其中 nan311.txt 中的文档如下:
0 ^$ ]0 O, ~  K8 T6 W% RThere is no hate without fear. Hate is crystallized fear, fear ’dividend, s fear $ m4 a1 Y/ S/ p5 v# l( U: z
objectivized. We hate what we fear and so where hate is, fear is lurking. Thus we hate what threatens our person, our vanity and our dreams and plans for ourselves. If we can isolate this element in what we hate we may be able to cease from hating.
8 S3 D( ]2 E9 W6 z

1 b7 R! l4 s4 g' F/ Q1 A七、实验总结, e6 z. v/ P/ }! J
通过这次实验, 我们懂得了不必运行程序时重新输入文档就可以对文档进行统计,既节省了时间而且也规避了一些输入错误。 在实验中, 我们进一步了解到信源熵的计算,理论和实践的结合让我们对这个知识点了解的更加深刻了。. _% V5 A. ?4 K# s- B

3 y; g- H3 P  W+ l# W
8 V, H% P5 s2 O6 a* r- g4 [* c. g( J+ x6 T& Y2 i/ V" o

6 U7 p, `( z8 G+ U) m: o
) ]6 `: o+ `1 p# C' t4 M# `9 S. Q! x# C5 v7 Z6 v  O1 K
) p6 Q  U0 O/ d. h

' ?% Y  ^3 N& M6 Y
  C+ s0 v0 v+ e: I! {+ j0 W: d
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

推荐内容上一条 /1 下一条

EDA365公众号

关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

GMT+8, 2025-6-9 02:26 , Processed in 0.078125 second(s), 26 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表