EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
本帖最后由 EDA365_PCB 于 2024-1-22 17:45 编辑
' r X- B+ g( i
/ O! i9 C5 G$ }$ h/ F( z4 G& HI2C七宗罪之第六罪——枯燥的协议
0 `# ?4 h4 q; C; bEDA365原创 作者:John % W! C9 y& U( G" [% k* U) N
( u7 s6 C3 z( p5 a& z/ m: I( d
, B" _1 V- O1 M P' B! v2 p% M" Q
. a( D& E( K$ Q8 M; K* t * c; Q* K6 n% v9 C
* ]4 o1 C0 g5 t- U越到后面的几宗罪,难度越来越大,请读者要认真仔细的思考,确保学为己用。: }) X. f2 ^$ ?+ k* H( K" a
- u" O" f: I" f% `) N
) }: b; e8 ^4 S3 [先来讲个有趣的故事,我们在大学里喜欢去图书馆自习的时候抢位置,特别是喜欢抢靠近漂亮女生旁边的位置,可以一边上自习一边欣赏美女,^_^ m6 U8 }- t2 @1 [( t
6 |' a. K1 I! K- G& p8 Q) {4 _2 l* c9 J' b9 C
$ A5 H6 p9 E, X$ B' D5 A
. ]/ R! f% S: F& F+ g6 [当你要临时离开一会儿的时候,方法也比较简单,就是放一本书在椅子上,很多时候当你回来的时候却发现你的书被人拿开了,椅子上坐着的另外一个帅哥和旁边的那位美女在攀谈,恨的牙痒痒啊。0 ]# Z- b l% P$ M% c! k% a7 G: g: H1 D) c
8 X; { D- r1 X& F- ]& w: M; r4 B9 P t( e6 E4 X) a( q! u
你能做的就是等那位帅哥和美女聊完走人,你再回到那个座位上,可是你却沮丧的发现,刚刚旁边那位美女也走了,换了另外一位男的,唉,人生最悲惨的事情不过如此。* w. I" l6 ?- c, V. K% y5 D H% v
4 U2 S( k& X) P- b! u5 j下面给出一张图,大家来看看是否存在问题。这张图是用I2C协议分析仪抓出来的,乍一看也没啥问题,该有的都有,特别是最后在Stop之前的NAK也是有的,但真的是OK的吗?9 r* s, r$ x+ Q0 F6 W+ i+ v& f# Q
我们再来看一张图。
0 z* N5 i/ n& I
- H+ [6 k% A5 M- G; V 对比这两张图,我们得出:这是一个读数据的操作。* z5 j W1 v! n: g) i
2 o0 Q' w* _, L5 C$ h, @
9 Q8 n3 Z# W8 H, T! l2 E& f0 Z要找到第一张图的问题其实不难,我们只要仔细核对就可以了。 R. G+ T8 r+ A6 a/ _# c
5 ^6 X4 G: i) [% [& g3 F6 j- Q
8 H3 I) Y/ {) k9 @: i6 g下面是核对出来的结果,我们发现在第二个Start之前,多了一个Stop。 这样一看,这个错误还是挺明显的。4 z! N/ u3 Z5 S+ u4 U$ _( J l# e @6 ~8 O8 Y( d. C. f I
; c; {- s9 s1 m: G
$ B/ v) q2 P' s Y* a! O* {说说总是很容易,软件工程师在代码里构建这个时序的时候,很自然会认为,前面第一笔的写操作(把Word address写入Slave的指针)已经结束,后面的一笔,读操作开始之前就应该Stop掉。
为了清洗的说明,我们列一个顺序如下:4 K& j' t: P$ v n B" y. D; M# P+ r8 ?; l3 C7 d8 f$ c5 P1 J3 P
$ f) q, A6 E) d/ }( O" e1.Master把要读的数据(或者寄存器)的Address先写入Slave,这里要注意理解好,这里Word Address相当于是一笔数据;0 N- P8 i. \8 g2 J+ S/ s5 {4 z
2.此时要注意整个读操作刚刚进行了一半,千万不能加Stop;0 l4 F Y! d% l6 X
3.Master在收到前面写操作的ACK后,发一个Start;; |0 i- l- \0 W4 \" X& Y/ ^6 F( c( @& p& D( s7 e) T, ^
4.Master再发一次Device Address,然后开始接收读的数据;/ M7 M) T; t& \, w7 j' p
3 y7 |3 X @& n( G; ^/ F. I5 ]5.Master收到数据发一个NAK, 然后再发一个Stop结束整笔操作。
- O# v7 \# @+ w9 W W- g- f8 p1 m) l7 x' ]: J
有人问,既然我们在第二个Start前多加了一个Stop,也没有见系统报错,一切正常啊,有时候访问还是成功的,这到底是为什么啊?
: J( l% I5 }+ W) W; F/ P! [- k. i$ U9 L; s+ ]% F, Z2 ^" |0 V0 k# f3 o4 R9 [) j4 G! F W2 K4 y
这里有个原因很重要:因为读操作最后是有Master发出的NAK + Stop来结束掉的,而NAK是SDA-HIGH,所以即便有时候操作不正常,只要不操作SDA(SDA默认的电平时HIGH),也能得到NAK误导对方。
. m& Q+ ]( W+ R [" Y1 H" k7 b3 s; }
我们继续来说一下,如果第二Start前面多了一个Stop会产生什么样的现象?7 k4 Y( R# j# C" P* _! B
" t. H3 g, Z: i& b9 G4 I
( z& Z# d1 X& m# X u( i这是发生在ONU光猫上的Issue,现象是:从光模块SFP读回来的数据值总是不对,反复试验发现偶尔也能读对,但是写操作都是准确的。& P" X/ |" | e9 X; }- i/ ^4 ?7 ?) N, _
+ Z; I( f- f% \5 S
这里一定会有人问,你读操作不正常,怎么知道写的是对的啊? 好问题, 我们通过设置环回和打开/关闭光模块等写寄存器操作,反复确认我们写寄存器的操作是准确的。
9 V2 E6 x2 ?5 @- _+ j9 Q0 Q3 Z; }" G0 ?9 D9 B3 i8 y
! N; R: \. S* N: p2 J7 z+ s$ f我们来看光模块的I2C读写标准SFF-8431里面的图,可以看到一次读操作和前面叙述的一样,分为两个部分,中间用一个START隔开。% H; e0 o! S$ D4 I8 e/ k6 K
1.Master写device address =0XA2和写命令
`% m$ D8 r3 g3 f6 l2.Master发出word address 0X6E, Q! h# i4 [# Z" \ x
3.Master插入第二个Start. b$ E9 H' K! C' J3 q5 F: [8 L& K
* A B5 h4 c3 P8 v* D7 f4 T# }( h! u5 k4.Master再次发出device address =0XA2和读命令6 K7 f# k0 D$ U! I# {' n
. w# q" A; f, t& ~$ P; m* g5.Master接收光模块的数据0X82! ]8 u6 }7 Q1 s2 a2 _7 O6 c
6.Master发NAK8 u8 E1 j7 Z' f2 B- x( u/ L
* [: V7 R" H: _7.Master发Stop结束本次操作
* M" } `! Q# M, d1 b注意:图中黑色部分是我们在Vendor的平台上用准确的方式读写抓到的波形。
- X/ {* E; W* q9 S( L& E8 y* d" m7 z9 `
, x, S4 f! u/ x如果按照上面所说的,我们在中间加了一个Stop会产生什么样的现象呢?# h- n+ g, k4 o, r# y% C
+ a- D: c, `5 n2 X$ w: a ^% G8 ^$ H# G! t* p o
为啥读数据会不正确,但是I2C总线并没有出错信息吖? 前面我们已经林林总总的叙述了一些,下面给出最终的描述。
# R* K7 K# s* i" ~/ m
1 T, l1 q9 X) m" z看下面这张图,是我们和Samtec的FAE在出问题的板子上一起抓到的波形图,很明显我们看到多了一个Stop,下面我们来进行分析:8 D0 \/ J4 H/ S"
1.Master写device address =0XA2和写命令
, n! s5 P6 w8 _. \3 B# e! q2.Master发出word address 0X6E$ B/ h9 Z" Q4 w- Q/ U! D. X+ E; R8 v F& l* L! I+ Z/ T
3.Master多插入了一个Stop+ ^9 p6 ^% \! [& i, A$ p- P9 i" W# J1 [
4.Master插入第二个Start, i& I# V( w, W. G0 Y- c4 R
注意:下面被插入了一笔完整的写数据的操作。. H; o8 l% M# K# \2 n7 g
1 E2 b: e/ e0 N" y3 V6 y6 n5 Y) G
' p& ]; T. X3 H% r& t5.Master又发出device address =0XA2和写命令
2 L {+ S/ I p7 b7 b6.Master发出word address 0X7F- }" i i e4 b+ P0 @4 e9 `. P! ~& `) F; X8 y8 ~( x
7.Master发出写的数据0X806 d( f+ N6 z7 m4 [ K4 u" Y
注意:开始接着上面未完成的读操作继续& `8 u: I" w$ M+ I& C {+ j
3 ?4 ?: ] U, q9 C: x$ f
7 c3 [: Y! M3 R' s: g' R2 G8.Master又多插入了一个Stop
" ? o n' S1 H# X4 y9.Master又插入第二个Start* E' \$ G( @* |2 n' [: f' J6 p& v9 ^: z
10.Master再次发出device address =0XA2和读命令9 L; O% k! B- |+ g* ^* H* Q) t7 r" Q, l
11.Master接收光模块的数据,我们看到读到的数据是全0,为什么呢?& L6 S5 l1 m/ O4 n) F- P- q6 y2 u& V! U) ]3 T4 W5 c
12.Master发NAK7 F, c" ?2 K7 v& G' U. s2 k1 q* I6 g. z; p
13.Master发Stop结束本次操作* S, m1 A5 C7 V4 g/ B" ?8 c
: `9 ^) P( O c* v+ j
7 x$ h4 ~' @$ u; i相信很多人已经晕了,这到底是咋回事啊?- B' Y: O6 }4 G; M. h8 c. l/ i4 G" r
: i/ j( D- ]0 L* S# a2 D
1 s/ @6 J4 ?; A& M( {; W! L原来:一笔读操作,由于中间多了一个Stop,所以系统软件进程误以为前面读操作完成了,所以横空插进来一个写的操作,并且这里的写操作准确的完成了。- E9 w; X# u4 `: D4 V" S% W9 g5 G) F3 \, |8 i1 b/ s8 q0 n
1 }' T! P* m+ K+ Q; V. F
在写操作完成了,我们看到Master试图继续完成刚刚被中断掉的读操作,其实这也可以啊,大不了分两次,只要最终数据能准确读出来也行,可我们此时得到的数据却不是刚刚的0X82了,而是0X00,这又是为什么呢?
我们来结合这张图描述一下发生错误的过程:
+ U7 F- L: m2 K! g/ R6 I: T& }8 G
1.Master开始读操作的第一步把0X6E写入Device;# g0 I- f. J4 n: {) r/ `
2.此时被插入另外一个写操作;- j9 u2 ~# a, R/ x+ ~
+ d3 f0 G8 o; Z4 z0 ?3.写操作顺利完成并且把Pointer写成了0X7F(注意已经不是原来的0X6E);# S& x' U* t- {: T1 }8 l- p. q0 n5 y8 z, h+ |; [
4.Master继续刚才被中断的写操作;. T& H) r$ K6 V. B- }' g- u- p* x$ e' a
, L) V4 B( k+ S Q9 Z5.注意此时Pointer的值是0X7F,所以读到的值是0X7F这个地址的值。
; ^% d& g& e: U c1 ]9 Z/ V. f1 g, f- P9 @0 Q" L+ U, k. W7 ]2 T6 [
这里就清楚了:一次完整的I2C读操作访问,如果中间加了不应该有的Stop,就会被其它进程强占,从而插入另外的写操作,导致访问memory或者寄存器的地址指针被覆盖,Master然后接着完成刚刚被中断的操作,也不能正确读写到要访问的值。2 w: p9 U. O+ Z1 [
g4 E, H* n. A( n$ d2 ?
+ W/ R4 f2 f5 q4 \+ p) [这里分享几件有趣的事:
' m: J& J& J1 @$ M" K# r$ ~+ a/ a; j1.由于只是读有问题,写操作是好的,所以产品的功能是OK的,在市场卖了那么多,都没有人发现这个问题,也蛮搞笑的;7 U1 c' w$ Y- K: q5 t/ _
2.I2C的读操作一直NAK操作是SDA=HIGH, 由于SDA默认就是High(前面讲过Open drain和上拉),所以即便设备没有做什么? 也会让等待NAK的设备误认为NAK已经产生了;
4 J' @+ y& G* o8 t# M; C5 | c0 G9 P6 q$ }3.系统软件有时候是会和硬件打架的,所以相互合作才能找到问题的根源,否则相互推责任只会让解决问题很困难;
! O" F; P2 v" Z4.发现问题并且解决问题,写个文章很简单,但是调试的过程却是痛苦的,特别是I2C这种接口,一共2根线,很多人比较轻视,这是不可取的。 4 l; ^! n! k0 s7 b: ]
注:本文为EDA365电子论坛原创文章,未经允许,不得转载。; o4 J0 U$ T$ E
|