找回密码
 注册
关于网站域名变更的通知
查看: 4897|回复: 6
打印 上一主题 下一主题

I2C七宗罪之第六罪

  [复制链接]
  • TA的每日心情
    开心
    2023-5-19 15:05
  • 签到天数: 339 天

    [LV.8]以坛为家I

    跳转到指定楼层
    1#
    发表于 2019-3-20 14:08 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

    EDA365欢迎您登录!

    您需要 登录 才可以下载或查看,没有帐号?注册

    x
    本帖最后由 EDA365_PCB 于 2024-1-22 17:45 编辑
    ' r  X- B+ g( i
    / O! i9 C5 G$ }$ h/ F( z4 G& H
    I2C七宗罪之第六罪——枯燥的协议

    0 `# ?4 h4 q; C; b
    EDA365原创 作者:John
    % W! C9 y& U( G" [% k* U) N
    ( u7 s6 C3 z( p5 a& z/ m: I( d

    , B" _1 V- O1 M  P' B! v2 p% M" Q
    . a( D& E( K$ Q8 M; K* t
    * c; Q* K6 n% v9 C
    * ]4 o1 C0 g5 t- U
    越到后面的几宗罪,难度越来越大,请读者要认真仔细的思考,确保学为己用。: }) X. f2 ^$ ?+ k* H( K" a
    - u" O" f: I" f% `) N
    ) }: b; e8 ^4 S3 [先来讲个有趣的故事,我们在大学里喜欢去图书馆自习的时候抢位置,特别是喜欢抢靠近漂亮女生旁边的位置,可以一边上自习一边欣赏美女,^_^  m6 U8 }- t2 @1 [( t
    6 |' a. K1 I! K- G& p8 Q) {4 _2 l* c9 J' b9 C
    $ A5 H6 p9 E, X$ B' D5 A

    . ]/ R! f% S: F& F+ g6 [当你要临时离开一会儿的时候,方法也比较简单,就是放一本书在椅子上,很多时候当你回来的时候却发现你的书被人拿开了,椅子上坐着的另外一个帅哥和旁边的那位美女在攀谈,恨的牙痒痒啊。0 ]# Z- b  l% P$ M% c! k% a7 G: g: H1 D) c
    8 X; {  D- r1 X& F- ]& w: M; r4 B9 P  t( e6 E4 X) a( q! u
    你能做的就是等那位帅哥和美女聊完走人,你再回到那个座位上,可是你却沮丧的发现,刚刚旁边那位美女也走了,换了另外一位男的,唉,人生最悲惨的事情不过如此。* w. I" l6 ?- c, V. K% y5 D  H% v
    4 U2 S( k& X) P- b! u5 j下面给出一张图,大家来看看是否存在问题。这张图是用I2C协议分析仪抓出来的,乍一看也没啥问题,该有的都有,特别是最后在Stop之前的NAK也是有的,但真的是OK的吗?9 r* s, r$ x+ Q0 F6 W+ i+ v& f# Q
    我们再来看一张图。
    0 z* N5 i/ n& I

    - H+ [6 k% A5 M- G; V
    对比这两张图,我们得出:这是一个读数据的操作。* z5 j  W1 v! n: g) i
    2 o0 Q' w* _, L5 C$ h, @
    9 Q8 n3 Z# W8 H, T! l2 E& f0 Z要找到第一张图的问题其实不难,我们只要仔细核对就可以了。  R. G+ T8 r+ A6 a/ _# c
    5 ^6 X4 G: i) [% [& g3 F6 j- Q
    8 H3 I) Y/ {) k9 @: i6 g下面是核对出来的结果,我们发现在第二个Start之前,多了一个Stop。 这样一看,这个错误还是挺明显的。4 z! N/ u3 Z5 S+ u4 U$ _( J  l# e  @6 ~8 O8 Y( d. C. f  I
    ; c; {- s9 s1 m: G
    $ B/ v) q2 P' s  Y* a! O* {说说总是很容易,软件工程师在代码里构建这个时序的时候,很自然会认为,前面第一笔的写操作(把Word address写入Slave的指针)已经结束,后面的一笔,读操作开始之前就应该Stop掉。
    为了清洗的说明,我们列一个顺序如下:4 K& j' t: P$ v  n  B" y. D; M# P+ r8 ?; l3 C7 d8 f$ c5 P1 J3 P

    $ f) q, A6 E) d/ }( O" e1.Master把要读的数据(或者寄存器)的Address先写入Slave,这里要注意理解好,这里Word Address相当于是一笔数据;0 N- P8 i. \8 g2 J+ S/ s5 {4 z
    2.此时要注意整个读操作刚刚进行了一半,千万不能加Stop;0 l4 F  Y! d% l6 X
    3.Master在收到前面写操作的ACK后,发一个Start;; |0 i- l- \0 W4 \" X& Y/ ^6 F( c( @& p& D( s7 e) T, ^
    4.Master再发一次Device Address,然后开始接收读的数据;/ M7 M) T; t& \, w7 j' p
    3 y7 |3 X  @& n( G; ^/ F. I5 ]5.Master收到数据发一个NAK, 然后再发一个Stop结束整笔操作。
    - O# v7 \# @+ w9 W  W- g- f8 p1 m) l7 x' ]: J
    有人问,既然我们在第二个Start前多加了一个Stop,也没有见系统报错,一切正常啊,有时候访问还是成功的,这到底是为什么啊?
    : J( l% I5 }+ W) W; F/ P! [- k. i$ U9 L; s+ ]% F, Z2 ^" |0 V0 k# f3 o4 R9 [) j4 G! F  W2 K4 y
    这里有个原因很重要:因为读操作最后是有Master发出的NAK + Stop来结束掉的,而NAK是SDA-HIGH,所以即便有时候操作不正常,只要不操作SDA(SDA默认的电平时HIGH),也能得到NAK误导对方。
    . m& Q+ ]( W+ R  [" Y1 H" k7 b3 s; }
    我们继续来说一下,如果第二Start前面多了一个Stop会产生什么样的现象?7 k4 Y( R# j# C" P* _! B
    " t. H3 g, Z: i& b9 G4 I
    ( z& Z# d1 X& m# X  u( i这是发生在ONU光猫上的Issue,现象是:从光模块SFP读回来的数据值总是不对,反复试验发现偶尔也能读对,但是写操作都是准确的。& P" X/ |" |  e9 X; }- i/ ^4 ?7 ?) N, _
    + Z; I( f- f% \5 S
    这里一定会有人问,你读操作不正常,怎么知道写的是对的啊? 好问题, 我们通过设置环回和打开/关闭光模块等写寄存器操作,反复确认我们写寄存器的操作是准确的。
    9 V2 E6 x2 ?5 @- _+ j9 Q0 Q3 Z; }" G0 ?9 D9 B3 i8 y
    ! N; R: \. S* N: p2 J7 z+ s$ f我们来看光模块的I2C读写标准SFF-8431里面的图,可以看到一次读操作和前面叙述的一样,分为两个部分,中间用一个START隔开。% H; e0 o! S$ D4 I8 e/ k6 K
    1.Master写device address =0XA2和写命令
      `% m$ D8 r3 g3 f6 l2.Master发出word address 0X6E, Q! h# i4 [# Z" \  x
    3.Master插入第二个Start. b$ E9 H' K! C' J3 q5 F: [8 L& K
    * A  B5 h4 c3 P8 v* D7 f4 T# }( h! u5 k4.Master再次发出device address =0XA2和读命令6 K7 f# k0 D$ U! I# {' n
    . w# q" A; f, t& ~$ P; m* g5.Master接收光模块的数据0X82! ]8 u6 }7 Q1 s2 a2 _7 O6 c
    6.Master发NAK8 u8 E1 j7 Z' f2 B- x( u/ L
    * [: V7 R" H: _7.Master发Stop结束本次操作
    * M" }  `! Q# M, d1 b注意:图中黑色部分是我们在Vendor的平台上用准确的方式读写抓到的波形。
    - X/ {* E; W* q9 S( L& E8 y* d" m7 z9 `
    , x, S4 f! u/ x如果按照上面所说的,我们在中间加了一个Stop会产生什么样的现象呢?# h- n+ g, k4 o, r# y% C
    + a- D: c, `5 n2 X$ w: a  ^% G8 ^$ H# G! t* p  o
    为啥读数据会不正确,但是I2C总线并没有出错信息吖? 前面我们已经林林总总的叙述了一些,下面给出最终的描述。
    # R* K7 K# s* i" ~/ m
    1 T, l1 q9 X) m" z看下面这张图,是我们和Samtec的FAE在出问题的板子上一起抓到的波形图,很明显我们看到多了一个Stop,下面我们来进行分析:8 D0 \/ J4 H/ S"
    1.Master写device address =0XA2和写命令
    , n! s5 P6 w8 _. \3 B# e! q2.Master发出word address 0X6E$ B/ h9 Z" Q4 w- Q/ U! D. X+ E; R8 v  F& l* L! I+ Z/ T
    3.Master多插入了一个Stop+ ^9 p6 ^% \! [& i, A$ p- P9 i" W# J1 [
    4.Master插入第二个Start, i& I# V( w, W. G0 Y- c4 R
    注意:下面被插入了一笔完整的写数据的操作。. H; o8 l% M# K# \2 n7 g
    1 E2 b: e/ e0 N" y3 V6 y6 n5 Y) G
    ' p& ]; T. X3 H% r& t5.Master又发出device address =0XA2和写命令
    2 L  {+ S/ I  p7 b7 b6.Master发出word address 0X7F- }" i  i  e4 b+ P0 @4 e9 `. P! ~& `) F; X8 y8 ~( x
    7.Master发出写的数据0X806 d( f+ N6 z7 m4 [  K4 u" Y
    注意:开始接着上面未完成的读操作继续& `8 u: I" w$ M+ I& C  {+ j
    3 ?4 ?: ]  U, q9 C: x$ f
    7 c3 [: Y! M3 R' s: g' R2 G8.Master又多插入了一个Stop
    " ?  o  n' S1 H# X4 y9.Master又插入第二个Start* E' \$ G( @* |2 n' [: f' J6 p& v9 ^: z
    10.Master再次发出device address =0XA2和读命令9 L; O% k! B- |+ g* ^* H* Q) t7 r" Q, l
    11.Master接收光模块的数据,我们看到读到的数据是全0,为什么呢?& L6 S5 l1 m/ O4 n) F- P- q6 y2 u& V! U) ]3 T4 W5 c
    12.Master发NAK7 F, c" ?2 K7 v& G' U. s2 k1 q* I6 g. z; p
    13.Master发Stop结束本次操作* S, m1 A5 C7 V4 g/ B" ?8 c
    : `9 ^) P( O  c* v+ j
    7 x$ h4 ~' @$ u; i相信很多人已经晕了,这到底是咋回事啊?- B' Y: O6 }4 G; M. h8 c. l/ i4 G" r
    : i/ j( D- ]0 L* S# a2 D
    1 s/ @6 J4 ?; A& M( {; W! L原来:一笔读操作,由于中间多了一个Stop,所以系统软件进程误以为前面读操作完成了,所以横空插进来一个写的操作,并且这里的写操作准确的完成了。- E9 w; X# u4 `: D4 V" S% W9 g5 G) F3 \, |8 i1 b/ s8 q0 n
    1 }' T! P* m+ K+ Q; V. F
    在写操作完成了,我们看到Master试图继续完成刚刚被中断掉的读操作,其实这也可以啊,大不了分两次,只要最终数据能准确读出来也行,可我们此时得到的数据却不是刚刚的0X82了,而是0X00,这又是为什么呢?
    我们来结合这张图描述一下发生错误的过程:
    + U7 F- L: m2 K! g/ R6 I: T& }8 G
    1.Master开始读操作的第一步把0X6E写入Device;# g0 I- f. J4 n: {) r/ `
    2.此时被插入另外一个写操作;- j9 u2 ~# a, R/ x+ ~
    + d3 f0 G8 o; Z4 z0 ?3.写操作顺利完成并且把Pointer写成了0X7F(注意已经不是原来的0X6E);# S& x' U* t- {: T1 }8 l- p. q0 n5 y8 z, h+ |; [
    4.Master继续刚才被中断的写操作;. T& H) r$ K6 V. B- }' g- u- p* x$ e' a
    , L) V4 B( k+ S  Q9 Z5.注意此时Pointer的值是0X7F,所以读到的值是0X7F这个地址的值。
    ; ^% d& g& e: U  c1 ]9 Z/ V. f1 g, f- P9 @0 Q" L+ U, k. W7 ]2 T6 [
    这里就清楚了:一次完整的I2C读操作访问,如果中间加了不应该有的Stop,就会被其它进程强占,从而插入另外的写操作,导致访问memory或者寄存器的地址指针被覆盖,Master然后接着完成刚刚被中断的操作,也不能正确读写到要访问的值。2 w: p9 U. O+ Z1 [
      g4 E, H* n. A( n$ d2 ?
    + W/ R4 f2 f5 q4 \+ p) [这里分享几件有趣的事:
    ' m: J& J& J1 @$ M" K# r$ ~+ a/ a; j1.由于只是读有问题,写操作是好的,所以产品的功能是OK的,在市场卖了那么多,都没有人发现这个问题,也蛮搞笑的;7 U1 c' w$ Y- K: q5 t/ _
    2.I2C的读操作一直NAK操作是SDA=HIGH, 由于SDA默认就是High(前面讲过Open drain和上拉),所以即便设备没有做什么? 也会让等待NAK的设备误认为NAK已经产生了;
    4 J' @+ y& G* o8 t# M; C5 |  c0 G9 P6 q$ }3.系统软件有时候是会和硬件打架的,所以相互合作才能找到问题的根源,否则相互推责任只会让解决问题很困难;
    ! O" F; P2 v" Z4.发现问题并且解决问题,写个文章很简单,但是调试的过程却是痛苦的,特别是I2C这种接口,一共2根线,很多人比较轻视,这是不可取的。
    4 l; ^! n! k0 s7 b: ]
    注:本文为EDA365电子论坛原创文章,未经允许,不得转载。; o4 J0 U$ T$ E

    本帖被以下淘专辑推荐:

    该用户从未签到

    推荐
    发表于 2020-5-11 10:47 | 只看该作者
    文章真的好

    “来自电巢APP”

    该用户从未签到

    2#
    发表于 2019-5-16 10:31 | 只看该作者
    生动的文章,分析得有条有理,赞~~!

    该用户从未签到

    3#
    发表于 2019-11-19 18:16 | 只看该作者
    各位,有john大神的联系方式吗,很想认识一下,我邮箱2929219135@qq.com
  • TA的每日心情
    开心
    2020-12-3 15:53
  • 签到天数: 38 天

    [LV.5]常住居民I

    4#
    发表于 2019-11-26 18:33 | 只看该作者
    看看,学习一下

    该用户从未签到

    5#
    发表于 2019-12-18 20:38 | 只看该作者
    谢谢资料分享

    该用户从未签到

    7#
    发表于 2023-6-12 19:01 | 只看该作者
    很多图片没有加载出来,楼主能麻烦再更新下图片吗??

    “来自电巢APP”

    您需要登录后才可以回帖 登录 | 注册

    本版积分规则

    关闭

    推荐内容上一条 /1 下一条

    EDA365公众号

    关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

    GMT+8, 2025-7-15 18:38 , Processed in 0.156250 second(s), 29 queries , Gzip On.

    深圳市墨知创新科技有限公司

    地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

    快速回复 返回顶部 返回列表