EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
本帖最后由 EDA365_PCB 于 2024-1-22 17:45 编辑 , s- V2 f* \, r. \5 j w. ^3 j
* G# C+ ~; r4 g! y sI2C七宗罪之第六罪——枯燥的协议
$ c T- A# n" h! _3 \/ `EDA365原创 作者:John % W! C9 y& U( G" [% k* U) N# k+ y# s/ T4 o1 s; f
1 b6 ^6 V# U" N
' B! v2 p% M" Q8 W0 F; F1 T Z# C% G
* c; Q* K6 n% v9 C( Q+ r8 v8 V# F( F* D0 T
越到后面的几宗罪,难度越来越大,请读者要认真仔细的思考,确保学为己用。9 u0 G' C# S2 t) g
- u" O" f: I" f% `) N
6 j. x! L: G! C. H3 y先来讲个有趣的故事,我们在大学里喜欢去图书馆自习的时候抢位置,特别是喜欢抢靠近漂亮女生旁边的位置,可以一边上自习一边欣赏美女,^_^ m6 U8 }- t2 @1 [( t
/ e: S0 |6 m+ |5 E4 _2 l* c9 J' b9 C
2 e3 C% P$ x5 S. X% _: C- m; ?7 H! I8 l/ C4 V7 D/ V5 n
当你要临时离开一会儿的时候,方法也比较简单,就是放一本书在椅子上,很多时候当你回来的时候却发现你的书被人拿开了,椅子上坐着的另外一个帅哥和旁边的那位美女在攀谈,恨的牙痒痒啊。0 ]# Z- b l% P2 F* h- f% C, T! P
8 X; { D- r1 X& F- ]& w6 Q' h7 n2 M6 y( {1 C' `
你能做的就是等那位帅哥和美女聊完走人,你再回到那个座位上,可是你却沮丧的发现,刚刚旁边那位美女也走了,换了另外一位男的,唉,人生最悲惨的事情不过如此。* w. I" l6 ?- c, V. K% y5 D H% v5 R, L/ ?+ {5 r( \) c
下面给出一张图,大家来看看是否存在问题。这张图是用I2C协议分析仪抓出来的,乍一看也没啥问题,该有的都有,特别是最后在Stop之前的NAK也是有的,但真的是OK的吗?9 r* s, r$ x+ Q0 F6 W+ i+ v& f# Q
我们再来看一张图。
; z& \( r. m8 k' S# a# L
4 N$ K; Z/ A) n* L! ?
对比这两张图,我们得出:这是一个读数据的操作。7 v: _" Q" X, w7 U& Q/ `) w' L# s/ v
2 o0 Q' w* _, L5 C$ h, @
6 _# a8 ]" ~5 _2 R& D+ n要找到第一张图的问题其实不难,我们只要仔细核对就可以了。
- n3 I+ k/ m; W% u# I# n: H5 O& }' {5 ^6 X4 G: i) [% [& g3 F6 j- Q! l& x9 O2 S: k; t, ?1 K
下面是核对出来的结果,我们发现在第二个Start之前,多了一个Stop。 这样一看,这个错误还是挺明显的。4 z! N/ u3 Z5 S+ u4 U$ _( J, s* D5 U, Q+ D, Q! U7 T% B3 ~. U
; c; {- s9 s1 m: G
6 b: X, ]0 \* ]$ `; P! g. S说说总是很容易,软件工程师在代码里构建这个时序的时候,很自然会认为,前面第一笔的写操作(把Word address写入Slave的指针)已经结束,后面的一笔,读操作开始之前就应该Stop掉。
为了清洗的说明,我们列一个顺序如下:4 K& j' t: P$ v n B" y. D; M# P+ r3 q: \% t* Y; V( Z8 X
: h- |% N* \6 o
1.Master把要读的数据(或者寄存器)的Address先写入Slave,这里要注意理解好,这里Word Address相当于是一笔数据;
: A2 G: ^ a% ~- |0 C3 @2.此时要注意整个读操作刚刚进行了一半,千万不能加Stop;
3 N2 @! d- i0 s% [( I3.Master在收到前面写操作的ACK后,发一个Start;; |0 i- l- \0 W4 \" X
; k& ]0 e9 T7 h: n4.Master再发一次Device Address,然后开始接收读的数据;/ M7 M) T; t& \, w7 j' p
$ c& }5 _; M P/ h! \5 E! ~$ `5.Master收到数据发一个NAK, 然后再发一个Stop结束整笔操作。) q6 l, e: [ S- |" S
! P" X; m" G) Q% u; l/ |+ e1 ?有人问,既然我们在第二个Start前多加了一个Stop,也没有见系统报错,一切正常啊,有时候访问还是成功的,这到底是为什么啊?
+ w0 K' a0 A, C* J( `8 O v$ U9 L; s+ ]% F, Z2 ^" |0 V
% @( U* `3 T% p3 F4 u2 C这里有个原因很重要:因为读操作最后是有Master发出的NAK + Stop来结束掉的,而NAK是SDA-HIGH,所以即便有时候操作不正常,只要不操作SDA(SDA默认的电平时HIGH),也能得到NAK误导对方。
9 W4 Z5 f, `) G% D. p* n; v# Z; q6 l7 z. c
我们继续来说一下,如果第二Start前面多了一个Stop会产生什么样的现象?+ Z6 K. Y! b: r% n2 \) _1 V3 ^' n
" t. H3 g, Z: i& b9 G4 I
3 N$ j# m3 J. O, ]4 f/ m- c这是发生在ONU光猫上的Issue,现象是:从光模块SFP读回来的数据值总是不对,反复试验发现偶尔也能读对,但是写操作都是准确的。& P" X/ |" | e9 X; }
) m$ c- [% c. z; |& z3 d
5 F/ f7 s; w. K( f# V3 ~这里一定会有人问,你读操作不正常,怎么知道写的是对的啊? 好问题, 我们通过设置环回和打开/关闭光模块等写寄存器操作,反复确认我们写寄存器的操作是准确的。
, X" N: `; F4 t5 A C& ?4 @) L& c3 Z; }" G0 ?9 D9 B3 i8 y
/ M5 {3 g5 o5 y0 S2 U, Y+ x我们来看光模块的I2C读写标准SFF-8431里面的图,可以看到一次读操作和前面叙述的一样,分为两个部分,中间用一个START隔开。% H; e0 o! S$ D4 I8 e/ k6 K
1.Master写device address =0XA2和写命令% E4 }5 e% y& h% g! R/ @
2.Master发出word address 0X6E8 M' M1 k4 N0 l
3.Master插入第二个Start. b$ E9 H' K! C' J3 q5 F: [8 L& K
* \) `! a3 N1 T* \1 U4.Master再次发出device address =0XA2和读命令6 K7 f# k0 D$ U! I# {' n: t! p0 G$ O5 w+ P& b: V2 ?& P- K6 e
5.Master接收光模块的数据0X82
& F7 T& [; O3 x6 ^/ w1 E' F6.Master发NAK8 u8 E1 j7 Z' f2 B- x( u/ L% k) z) C: w, I; B$ l$ M/ `2 W+ ?
7.Master发Stop结束本次操作
g* W0 D6 c4 q4 J/ q' j注意:图中黑色部分是我们在Vendor的平台上用准确的方式读写抓到的波形。
% A" r7 M) g) g9 S( L& E8 y* d" m7 z9 `( y3 w. c, t2 G7 {. }0 h
如果按照上面所说的,我们在中间加了一个Stop会产生什么样的现象呢?
# E: m$ a" [5 x' e2 ]+ B: r; p* o+ a- D: c, `5 n. G0 p7 }+ B. }6 }7 M& O1 {9 n, [
为啥读数据会不正确,但是I2C总线并没有出错信息吖? 前面我们已经林林总总的叙述了一些,下面给出最终的描述。
' L' K& d; v" z" B
5 H8 S& `: J7 u& H: ~4 Z( V+ ]/ C: _看下面这张图,是我们和Samtec的FAE在出问题的板子上一起抓到的波形图,很明显我们看到多了一个Stop,下面我们来进行分析:8 D0 \/ J4 H/ S"
1.Master写device address =0XA2和写命令5 @7 T2 J4 D0 K# u1 v2 f0 y m
2.Master发出word address 0X6E$ B/ h9 Z" Q4 w- Q/ U! D. X' a' ?, T! n2 b- |* B: F
3.Master多插入了一个Stop+ ^9 p6 ^% \! [& i
' W X/ _9 J, H! t6 b4.Master插入第二个Start
9 B b* N5 A: m注意:下面被插入了一笔完整的写数据的操作。. H; o8 l% M# K# \2 n7 g
$ H9 X$ ]( S8 j' m S7 w& p) B
* d- ~4 @, H, K5.Master又发出device address =0XA2和写命令* n7 R2 t6 g9 C8 t% ?
6.Master发出word address 0X7F- }" i i e4 b+ P0 @4 e0 K2 \) z0 i- g! L
7.Master发出写的数据0X80
, l6 G+ F) j, f2 I8 c注意:开始接着上面未完成的读操作继续
[9 L6 L& N# M, ~/ E+ X/ Y3 ?4 ?: ] U, q9 C: x$ f
: W7 \% ^. T% j( c$ C5 F- H8.Master又多插入了一个Stop
( b( L; l5 |5 f9.Master又插入第二个Start* E' \$ G( @* |2 n' [: f
$ N; i) x* n& B6 U% U5 M10.Master再次发出device address =0XA2和读命令9 L; O% k! B- |+ g
0 B1 D3 h# ?3 @- D; G" q7 B. F11.Master接收光模块的数据,我们看到读到的数据是全0,为什么呢?& L6 S5 l1 m/ O4 n) F- P: G" i5 N2 Z/ A7 s& k, L
12.Master发NAK7 F, c" ?2 K7 v& G' U. s
1 Z" L: J+ r! z k13.Master发Stop结束本次操作
: S, e' ?/ H$ ~: `9 ^) P( O c* v+ j( k! u2 O# G' U, W( o1 c- t7 {( s
相信很多人已经晕了,这到底是咋回事啊?- B' Y: O6 }4 G; M! o& p, e& d/ y& O; i! ?: c
: i/ j( D- ]0 L* S# a2 D
$ B/ C$ Y! g* i) b# i* d3 y. c原来:一笔读操作,由于中间多了一个Stop,所以系统软件进程误以为前面读操作完成了,所以横空插进来一个写的操作,并且这里的写操作准确的完成了。- E9 w; X# u4 `: D4 V" S% W9 g& b/ }& p* R0 E1 K2 ^# ~+ |
. w: M# f" \9 j8 N在写操作完成了,我们看到Master试图继续完成刚刚被中断掉的读操作,其实这也可以啊,大不了分两次,只要最终数据能准确读出来也行,可我们此时得到的数据却不是刚刚的0X82了,而是0X00,这又是为什么呢?
我们来结合这张图描述一下发生错误的过程:
2 i7 t4 k* u, H
0 f C! J, a* K8 w1.Master开始读操作的第一步把0X6E写入Device;9 l: w" s, A# E8 J% `
2.此时被插入另外一个写操作;- j9 u2 ~# a, R/ x+ ~
/ |# q# i! J( X8 {8 @* Y3.写操作顺利完成并且把Pointer写成了0X7F(注意已经不是原来的0X6E);# S& x' U* t- {: T1 }8 l+ ^9 i+ @1 p0 [$ F
4.Master继续刚才被中断的写操作;. T& H) r$ K6 V. B- }' g- u- p* x$ e' a1 u Y5 E2 \2 Q4 \0 }- p" |( G
5.注意此时Pointer的值是0X7F,所以读到的值是0X7F这个地址的值。: G4 y. d0 D1 z" G a
c1 ]9 Z/ V. f1 g, f- P
! _$ d: f3 [/ y5 s* {. n这里就清楚了:一次完整的I2C读操作访问,如果中间加了不应该有的Stop,就会被其它进程强占,从而插入另外的写操作,导致访问memory或者寄存器的地址指针被覆盖,Master然后接着完成刚刚被中断的操作,也不能正确读写到要访问的值。
% n+ @8 o4 z: F/ x# X' V g4 E, H* n. A( n$ d2 ?7 w7 F' O/ r* _. \) a( w
这里分享几件有趣的事:
% }8 `; p9 V; I: ]6 i. T/ T! A1.由于只是读有问题,写操作是好的,所以产品的功能是OK的,在市场卖了那么多,都没有人发现这个问题,也蛮搞笑的;7 [$ @' ?) c- F- J/ X; }4 ~
2.I2C的读操作一直NAK操作是SDA=HIGH, 由于SDA默认就是High(前面讲过Open drain和上拉),所以即便设备没有做什么? 也会让等待NAK的设备误认为NAK已经产生了;7 F, O) s* [. o8 ^. c: o% V
3.系统软件有时候是会和硬件打架的,所以相互合作才能找到问题的根源,否则相互推责任只会让解决问题很困难;
7 i4 I5 r) Z8 x. U% ~4.发现问题并且解决问题,写个文章很简单,但是调试的过程却是痛苦的,特别是I2C这种接口,一共2根线,很多人比较轻视,这是不可取的。 0 D6 W5 u+ K8 I
注:本文为EDA365电子论坛原创文章,未经允许,不得转载。
7 N' M; U; O+ B |