找回密码
 注册
关于网站域名变更的通知
查看: 346|回复: 2
打印 上一主题 下一主题

FPGA 高级设计:时序分析和收敛

[复制链接]

该用户从未签到

跳转到指定楼层
1#
 楼主| 发表于 2024-6-17 17:10 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您登录!

您需要 登录 才可以下载或查看,没有帐号?注册

x
今天给大侠带来FPGA 高级设计:时序分析和收敛,话不多说,上货。
8 f: A% j! L( T, Q6 c9 l9 o; `7 L! }, l

! J* {3 P1 E2 s

这里超链接一篇之前的STA的文章,仅供各位大侠参考。


. o) Y: o7 h) Y+ Z

FPGA STA(静态时序分析)4 |: u- K% p3 S7 `

: W7 M" _- a* q- U4 L7 z

什么是静态时序分析?静态时序分析就是Static Timing Analysis,简称 STA。它可以简单的定义为:设计者提出一些特定的时序要求(或者说是添加特定的时序约束),套用特定的时序模型,针对特定的电路进行分析。分析的最终结果当然是要求系统时序满足设计者提出的要求。

! t9 a7 s* h" f1 X6 G$ H* b

& V& y+ q. t; q+ s8 C- S

下面举一个最简单的例子来说明时序分析的基本概念。

( i5 A! d. g- a3 y- b: V) Z% ]

假设信号需要从输入到输出在FPGA 内部经过一些逻辑延时和路径延时。我们的系统要求这个信号在 FPGA 内部的延时不 能超过 15ns,而开发工具在执行过程中找到了如图 1 所示的一些可能的布局布线方式。

/ y7 R) V2 U5 E7 Q7 M4 @

9 W  X  D; R: J7 E5 m  T- a8 O

那么,怎样的布局布线能够达到我们的要求呢?仔细分析一番,发现所有路径的延时可能为 14ns、14ns、16ns、17ns、18ns,有两条路径能够满足要求,布局布线就会选择满足要求的两条路径之一。


& A) E8 `6 B9 J& i) W8 A* p! ~

( T8 x& W/ X. [$ }8 G: _

2 P2 _5 E4 N; F

& H3 S" i+ d5 O# v4 q( r7 n

, n: `( g7 `/ w5 `4 q: A

图 1 静态时序分析模型

' ^  C9 H* c; R* Z1 B
/ W. T8 h. R( |( _9 ^2 |7 F( s3 v
7 v9 U4 m6 R7 j" C, D5 i
5 u! Y% k/ Y9 [3 k/ d- a

( F) Q  F- \. M# T
0 v1 x0 G+ P  E9 O6 w

因此,有些说法是错误的,不分什么情况就说时序不收敛,其实在不加约束的情况下谈 时序约束是没有意义的。

& w9 l/ y/ s! n1 n


  n% ?+ u" ^8 ?. f2 K

附加约束的基本作用:


" }! Q- E; v( R4 ^

: m4 n  _/ q  F" v9 x% v, W7 R

1、提高设计的工作频率

' f, p5 D4 k- J- ]

! S$ h! d6 d1 Y4 p  I0 f% n6 a% j

对很多数字电路设计来说,提高工作频率非常重要,因为高工作频率意味着高处理能力。 通过附加约束可以控制逻辑的综合、映射、布局和布线,以减小逻辑和布线延时,从而提高 工作频率。

# f1 b) U% x/ L  \

2、获得正确的时序分析报告

$ Z+ m  {/ J% ]" T% M. J* ]

7 S2 z7 ~2 `" }/ r

几乎所有的 FPGA 设计平台都包含静态时序分析工具,利用这类工具可以获得映射或 布局布线后的时序分析报告,从而对设计的性能做出评估。静态时序分析工具以约束作为判断时序是否满足设计要求的标准,因此要求设计者正确输入约束,以便静态时序分析工具输 出正确的时序分析报告。


5 J  \5 m+ S7 N5 c9 d( K

3、指定 FPGA/cpld 引脚位置与电气标准

7 P# i4 a/ p$ J/ a( m, m

; n8 N/ H6 T* }& M) {7 Z

FPGA/CPLD 的可编程特性使电路板设计加工和 FPGA/CPLD 设计可以同时进行,而不必等 FPGA/CPLD 引脚位置完全确定,从而节省了系统开发时间。这样,电路板加工完成后, 设计者要根据电路板的走线对 FPGA/CPLD 加上引脚位置约束,使 FPGA/CPLD 与电路板正确连接。另外通过约束还可以指定 IO 引脚所支持的接口标准和其他电气特性。为了满足日 新月异的通信发展,Xilinx 新型 FPGA/CPLD 可以通过 IO 引脚约束设置支持诸如 AGP、 BLVDS、CTT、GTL、GTLP、HSTL、LDT、LVCMOS、LVDCI、LVDS、LVPECL、LVDSEXT、 LVTTL、PCI、PCIX、SSTL、ULVDS 等丰富的 IO 接口标准。另外通过区域约束还能在 FPGA上规划各个模块的实现区域,通过物理布局布线约束,完成模块化设计等。

& F( p, y1 S& H8 [2 {* w5 ~/ _+ m1 ^


0 D7 K- J/ y8 Q! e; {

静态时序分析中使用的各个模型分析:

  g8 o6 r: ], g( O- I0 X$ \

1、周期(PERIOD)的含义


  q  {9 d, Z7 m/ f+ [7 W- e

& k- y7 v2 V! I+ q9 r, u4 \. D

周期的含义是时序中最简单也是最重要的含义,其它很多时序概念会因为软件商不同略有差异,而周期的概念确是最通用的,周期的概念是 FPGA/ASIC 时序定义的基础概念。后面要讲到的其它时序约束都是建立在周期约束的基础上的,很多其它时序公式,可以用周期公式推导。周期约束是一个基本时序和综合约束,它附加在时钟网线上,时序分析工具根据PERIOD 约束检查时钟域内所有同步元件的时序是否满足要求。PERIOD 约束会自动处理寄存器时钟端的反相问题,如果相邻同步元件时钟相位相反,那么它们之间的延迟将被默认限制为 PERIOD 约束值的一半,如图 2 所示


$ |. D+ P0 {# K! D$ o# `" K8 H  |


8 q4 Q, r$ y4 y+ D* G4 M

3 H0 O( Z$ b  @$ a6 x9 J8 K


" A1 t4 a2 |8 e8 P1 J+ V. A  w

图 2 周期定义
( p! i; i2 k  V  B& h9 ?0 Z

0 Q& k% M8 z  ?7 d
) t. k$ G9 i  i0 {
9 A9 ^2 q; }8 z2 B
5 p* ^! s; t: F/ F

时钟的最小周期为:


- _* z+ p1 l% m! @7 B3 r( @% G

TCLK = TCKO + TLOGIC + TNET + TSETUP - TCLK_SKEW

TCLK_SKEW = TCD1 - TCD2(稳定时为负的)


! K% K# g6 w* e6 s  |2 O! |

其中 TCKO 为时钟输出时间,TLOGIC 为同步元件之间的组合逻辑延迟,TNET 为网线 延迟,TSETUP 为同步元件的建立时间,TCLK_SKEW 为时钟信号 TCD2 和 TCD1 延迟的差别。


  D5 a% Z  h& A2 m0 k. ?+ x

+ F0 [! v# a8 v, w! E  G

2、关于输入到达时间

' D1 ^* F. Q1 Z
9 t- H4 ?& `2 n  c$ f: u

! j$ ^/ R+ w5 }$ m  l/ T) R/ G9 |& m% |5 V

. \0 m! G" a9 {: f  ~; ~* h% U8 y1 S$ O3 b! P

# Y, g0 Y8 L& O3 K0 K+ c' C( y& Y

' W! W) k  w3 z0 r  L( R

/ ~( `9 y- Z8 N  E
图 3 输入到达时间示意图


, v6 q* u. o. B

定义的含义是输入数据在有效时钟沿之后的 TARRIVAL 时刻到达。则

TARRIVAL = TCKO + TOUTPUT + TLOGIC(1)


, ^0 ]2 e4 L3 Y

根据上面介绍的周期(Period)公式,我们可以得到:

Tcko + Toutput + Tlogic + Tinput + Tsetup - Tclk_skew = Tclk(2)


( g% z4 t' k$ E  P9 R

将公式 1 代入公式 2:Tarrival + Tinput + Tsetup - Tclk_skew = Tclk,而 Tclk_skew 满足时序关系后为负,所以 TARRIVAL + TINPUT + TSETUP < Tclk(3)。

; F9 U# O: L/ ~( E2 h8 G  q


: A; q; F2 [% M

这就是 Tarrival 应该满足的时序关系。其中 TINPUT 为输入端的组合逻辑、网线和 PAD的延迟之和,TSETUP 为输入同步元件的建立时间。


2 w* u* g" V) y, e( N; `

3、数据延时和数据到达时间的关系


+ |+ t1 f/ J% F& A6 U, x4 n
$ f" J/ O- A8 b& W) z

  n* o- _0 V: u+ e* I% T  X. V7 G, B/ G- C7 I! u  Q- e: j' Z! S2 h7 F

3 Y. r8 v9 J: r" s* _) h+ N) o9 I! @+ b: B, X1 N4 l$ {- @* D

图 4 数据延时和数据到达时间的关系


" ]: X4 W& l+ x) B# X5 n

TDELAY 为要求的芯片内部输入延迟,其最大值 TDELAY_MAX 与输入数据到达时间 TARRIVAL 的关系如图 4 所示。也就是说:

/ ~$ k/ ~2 B* v6 Q( }  J

TDELAY_MAX + TARRIVAL = TPERIOD(4)

所以:

TDELAY < TDELAY_MAX = TPERIOD - TARRIVAL(5)

' P. i5 P. ?! o; k- D# ^$ d

4、要求输出的稳定时间


$ ~; L' ?& r' i# F$ E- }& b7 S! _# n' w1 j5 g

从下一级输入端的延迟可以计算出当前设计输出的数据必须在何时稳定下来,根据这个 数据对设计输出端的逻辑布线进行约束,以满足下一级的建立时间要求,保证下一级采样的 数据是稳定的。计算要求的输出稳定时间如图 5 所示:


' }: h! ^! N: S: j! t' J* f# m

+ k  x7 p& d& d) }$ p
0 Q" T+ q& `- V5 {( o( H1 O
图 5 要求的输出稳定时间示意图
7 j* ~6 R  V$ c, F

公式的推导如下:

定义:TSTABLE = TLOGIC + TINPUT + TSETUP

, h0 D8 c, J3 N/ L% A4 ?7 a

从前面介绍的周期(Period)公式,可以得到(其中 TCLK_SKEW = TCLK1 - TCLK2):

TCLK = TCKO + TOUTPUT + TLOGIC + TINPUT + TSETUP + TCLK_SKEW

. j, Q) A% M* {9 Z; T

将 TSTABLE 的定义代入到周期公式,可以得到:

TCLK = TCKO + TOUTPUT + TSTABLE + TCLK_SKEW

* J1 M0 V8 {7 q6 i# y* W. G! F& p

所以:TCKO + TOUTPUT + TSTABLE < TCLK

6 v8 P; l8 ^! \

这个公式就是 TSTABLE 必须要满足的基本时序关系,即本级的输出应该保持怎么样的 稳定状态,才能保证下级芯片的采样稳定。有时我们也称这个约束关系是输出数据的保持时 间的时序约束关系。只要满足上述关系,当前芯片输出端的数据比时钟上升沿提早 TSTABLE 时间稳定下来,下一级就可以正确地采样数据。其中 TOUTPUT 为设计中连接同步元件输出端的组合逻辑、网线和 PAD 的延迟之和,TCKO 为同步元件时钟输出时间。


+ f- {, J% P' [$ U: `8 J

下面阐述的是上面的时序概念对应于 Altera 中的几个重要的时序问题。


* X/ ~$ H, m; ~- i4 s- n

下面主要介绍 Altera 对应的这些时序概念和约束方法。前面首先介绍的第一个时序概念周期(Period),这个概念是 FPGA/ASIC 通用的一个概念,各方的定义相当统一,至多是描 述方式不同罢了,所有的 FPGA 设计都首先要进行周期约束,这样做的好处除了在综合与 布局布线时给出规定目标外,还能让时序分析工具考察整个设计的 Fmax 等。


/ L" u7 [; Y9 y( W( S& M

Altera 的周期定义如图 6 所示,公式描述如下:


- ^, y; U4 P5 I
+ Y- `/ i1 k4 {7 F2 d9 R

3 A; x* S+ l$ _7 N9 L2 }4 U# ~

( F% f7 v8 K5 k. ]: C图 6 Altera-clock period3 W" s& o6 V, `; }

Clock Period = Clk – to – out + Data Delay + Setup Time - Clk Skew,

即: Tclk = Tco + B + Tsu - (E-C) Fmax =1/Tclk

$ E) d- @; h% k

) d, X# d' Q/ ~, m

对比一下前面的介绍,只要理解了 B 包含了两级寄存器之间的所有 logic 和 net 的延时 就会发现与前面公式完全一致。

* Q% ]. g9 ^- ?& g8 K( z
& X4 z4 b' s9 U7 W; K

* d1 T8 E% J; y+ v% d; U

其他一些重要的概念:


5 A) z  A2 G* G5 r+ @

1、Clock Setup Time(tsu)

+ f, r8 h1 C$ q! g% L  A
: N0 Z; {0 A7 `; V! B

要想正确采样数据,就必须使数据和使能信号在有效时钟沿到达前就准备好,所谓时钟建立时间就是指时钟到达前,数据和使能已经准备好的最小时间间隔。如图 7 所示:


0 u/ ^' Y' R: _: g% K2 m  g* B7 t- l0 D! b. z

' s9 B/ I1 J0 U# p9 D

9 W4 s+ U" t0 b8 i
/ U! L* H( \- h. m

图 7 tsu 示意图


; J8 s4 l% B. d' x$ `! I, s' D& F' Y

这里定义Setup时间是站在同步时序整个路径上的,需要区别的是另一个概念Micro tsu。Micro tsu 指的是一个触发器内部的建立时间,它是触发器的固有属性,一般典型值小于1~2ns。在 Xilinx 等的时序概念中,称 Altera 的 Micro tsu 为 setup 时间,用 Tsetup 表示,请 大家区分一下。


8 b2 m) U6 W5 F& g& r; O9 [# w4 W

回到 Altera 的时序概念,Altera 的 tsu 定义如下:

tsu = Data Delay – Clock Delay + Micro tsu

; O7 W0 O; X' p9 q

2、Clock Hold Time(tH)

- }6 ^+ w6 P1 z" G% N6 T
! `: ?4 p1 N% ?( `% z

时钟保持时间是只能保证有效时钟沿正确采用的数据和使能信号的最小稳定时间。其定 义如图 8 所示:


: z5 S0 s) w6 h' J! b+ x+ G7 R  O4 `% r  f" i/ F$ J5 q& ]" e


6 h/ `, n  {" d* g
- e0 @9 I) [! @! ~  L  `9 |& l+ P9 n1 K. ?5 P  u

图 8 tH示意图


$ X- Y$ M( z$ _8 c8 n

时钟保持时间是只能保证有效时钟沿正确采用的数据和使能信号的最小稳定时间。其定 义如下图所示:定义的公式为:tH = Clock Delay – Data Delay + Micro tH 注:其中 Micro tH 是指寄存器内部的固有保持时间,同样是寄存器的一个固有参数, 典型值小于 1~2ns。

7 j6 j0 S3 z2 P8 D2 J

3、Clock-to-Output Delay(tco)

* w$ b( Z8 p4 J4 _4 O: R; l
( O& T, w- R+ q7 M. f

这个时间指的是当时钟有效沿变化后,将数据推倒同步时序路径的输出端的最小时间间隔。如图 9 所示:


; n& y, f' q: V5 {- b) s5 q1 V; F$ l
$ x' l) E* T. g4 U$ ~* o& [2 T. y

( R! @$ Y& c2 n1 \& B
  V$ r5 @- a' q2 g* N: U" ~

图 9 tco 示意图

- B/ t6 x+ W. B! a2 n

: ^9 n: u4 m" z5 E$ q/ r1 B

定义:tco = Clock Delay + Micro tco + Data Delay

7 }+ e5 T% S% B2 H" J

注:其中 Micor tco 也是一个寄存器的固有属性,指的是寄存器相应时钟有效沿,将数 据送到输出端口的内部时间参数。它与 Xilinx 的时序定义中,有一个概念叫 Tcko 是同一个概念。


9 [, G5 r. h6 x2 B" C

4、Pin to Pin Delay(tpd)

: X, c) q! |; w

tpd 指输入管脚通过纯组合逻辑到达输出管脚这段路径的延时,特别需要说明的是,要求输入到输出之间只有组合逻辑,才是 tpd 延时。

! E/ f: s  v; u/ |  l

5、Slack


% x0 C. g2 ^5 G, W

Slack 是表示设计是否满足时序的一个称谓,正的 Slack 表示满足时序(时序的余量),负的 Slack 表示不满足时序(时序的欠缺量)。

" f7 A' h$ u$ P; K7 I2 J+ G
- E# n% A  `8 f6 ~

Slack 的定义和图形如图 10 所示:


2 C3 n9 E, B8 P; Y( [0 W8 u& `& H, e4 Q, \* B* d7 m6 q" z% f" Y

- f1 o$ ?3 B+ ~) s, a

6 v' Q/ l' C0 ?/ W7 ^" x5 k5 L0 \9 `8 f1 H3 w/ e: M

图 10 Slack 示意图

$ @2 j, M$ i" w# ~- D% u/ E- z

Slack = Required clock period – Actual clock period Slack = Slack clock period – ( Micro tCO + Data Delay + Micro tSU )

; W2 M: \& G6 @: F

6、始终偏斜

: V# m3 e5 Q" K) H' I2 c4 x

Clock Skew 指一个同源时钟到达两个不同的寄存器时钟端的时间偏移,如图 11 所示:


1 j; ~. h/ L; V, o) i$ L
% r- o$ N. d3 h3 M5 t

" @; v) _7 j3 i5 \- [

) N/ R) }- V2 `' }! L" Y) \: D

图 11 clock skew 示意图


8 d; m" W0 T7 |' l% W& N8 U
9 S$ v# `9 i4 o  h
5 E9 h4 v% W+ \8 f0 `' H
  • TA的每日心情
    开心
    2025-10-2 15:42
  • 签到天数: 1185 天

    [LV.10]以坛为家III

    3#
    发表于 2024-7-9 15:12 | 只看该作者
    很好的资料,讲的深度详尽专业,内容丰富透彻,学下
    您需要登录后才可以回帖 登录 | 注册

    本版积分规则

    关闭

    推荐内容上一条 /1 下一条

    EDA365公众号

    关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

    GMT+8, 2025-10-4 21:43 , Processed in 0.140625 second(s), 26 queries , Gzip On.

    深圳市墨知创新科技有限公司

    地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

    快速回复 返回顶部 返回列表