EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
所谓流水线处理,如同生产装配线一样,将操作执行工作量分成若干个时间上均衡的操作段,从流水线的起点连续地输入,流水线的各操作段以重叠方式执行。这使得操作执行速度只与流水线输入的速度有关,而与处理所需的时间无关。这样,在理想的流水操作状态下,其运行效率很高。
; u' r3 S/ @/ _! h( j( Q+ C 如果某个设计的处理流程分为若干步骤,而且整个数据处理是单流向的,即没有反馈或者迭代运算,前一个步骤的输出是下一个步骤的输入,则可以采用流水线设计方法来提高系统的工作频率。
3 [! m2 s0 [8 G- G# n9 C( Z* w/ {, y# a$ c 下面用8位全加器作为实例,分别列举了非流水线方法、2级流水线方法和4级流水线方法。(1)非流水线实现方式module adder_8bits(din_1, clk, cin, dout, din_2, cout);
: g _" b D& ?3 S+ U input [7:0] din_1;
' X+ H9 |/ J+ j( t input clk;2 `$ {7 B; Z; S4 C: p
input cin;
* l7 {4 J- N. G% [5 _" y8 J/ i output [7:0] dout;, c" g/ y( i2 ^
input [7:0] din_2;4 C. \( P+ @# w+ o$ I/ G+ p0 r' |
output cout;/ w( o# ]6 o/ L2 ?/ U/ t
c8 b/ p0 B- c' L o/ |! |, v! F" \' J
reg [7:0] dout;+ \% n" c5 V9 k/ }
reg cout;
: ^8 S" l5 ~9 j* k " D4 ]" q5 ?9 L& `$ W: o" w7 ?
always @(posedge clk) begin
, O0 I9 `! c4 T8 p/ A1 R- Y( J- R {cout,dout} <= din_1 + din_2 + cin;
4 i. y( U" D$ x0 v4 A5 P end
, l7 _* l& Q. c" h( A* w' [9 }3 b! A5 r6 K6 t
endmodule
2 q7 B3 M* X. {/ h2 N) c(2)2级流水线实现方式: module adder_4bits_2steps(cin_a, cin_b, cin, clk, cout, sum);
" s; l$ f( E5 y. Q8 s) @- j) w input [7:0] cin_a;( [# E2 S& J1 w( Y. H; z' z
input [7:0] cin_b;
. i: T0 m7 F0 q$ W) |. r( H B input cin;
, t, E( C; |" l. ]; S! ]- p input clk;
5 D9 {, y9 x& f" ~- P output cout;6 f# @2 T5 K7 T! A
output [7:0] sum;
( n8 I' y2 A& g# D& H- Q9 L# s
, |! M8 o& j' X% {) Y! f reg cout;
7 |. m, r, ]/ J$ p reg cout_temp;' F5 ^8 C0 S2 }7 R' ?
reg [7:0] sum;
# ]/ m' U% x, V/ y, b4 c- \( q reg [3:0] sum_temp;
( E% h1 A) V8 c N/ M
$ j$ Z( v; ?, z always @(posedge clk) begin4 z5 ?; e/ v3 e- g
{cout_temp,sum_temp} = cin_a[3:0] + cin_b[3:0] + cin;
. ~! i5 R$ m' _# i6 ] end
- ] H) \% S+ }5 g 6 D7 u7 l) n8 F
always @(posedge clk) begin
- k# T9 j6 T4 o. g- E {cout,sum} = {{1'b0,cin_a[7:4]} + {1'b0,cin_b[7:4]} + cout_temp, sum_temp};( y+ W. k2 }+ T& B( @6 m
end
r6 O: M7 e# u3 q- y) y& Mendmodule
( J3 r) r, ], k2 T2 J) V# ~, Y注意:这里在always块内只能用阻塞赋值方式,否则会出现逻辑上的错误! (3)4级流水线实现方式: module adder_8bits_4steps(cin_a, cin_b, c_in, clk, c_out, sum_out);4 ?, C& F4 F+ X) I! ]
input [7:0] cin_a;
1 u1 r' C1 E7 Y input [7:0] cin_b;
, Z$ |" }, Z( _ input c_in;. n5 n7 ^' ^ K7 E7 M
input clk;
E1 w+ Q4 U5 E' n/ U output c_out;
! w: g% w) D/ ` output [7:0] sum_out;
% u3 P+ z/ t% P5 `5 k - I( \' o* g) K8 L: E6 A% f
reg c_out;
- s7 F- l9 M. Q. N% O5 W reg c_out_t1, c_out_t2, c_out_t3;
9 I0 Z4 z$ q4 D
! v+ ]' r4 \7 _' g- { reg [7:0] sum_out;
. p/ n ]3 b9 Z* H0 Q reg [1:0] sum_out_t1;5 z1 G$ |" P( ]6 O& ?
reg [3:0] sum_out_t2;
& m, r8 a* l, N reg [5:0] sum_out_t3;
1 c/ d$ A4 ]! ^5 p0 M" N' R* \! n7 }
- e. [3 p2 J4 ] always @(posedge clk) begin1 s2 H1 j3 S7 k2 Q5 p0 W+ G
{c_out_t1, sum_out_t1} = {1'b0, cin_a[1:0]} + {1'b0, cin_b[1:0]} + c_in;
6 ~$ t2 R" M) K3 q( W7 W end! N( U0 \3 X+ b2 L% @4 f# h" l
5 H7 b+ n' M2 Y; j3 A1 T
always @(posedge clk) begin' b; n% \7 C* O3 C+ p5 {5 M) h R7 j
{c_out_t2, sum_out_t2} = {{1'b0, cin_a[3:2]} + {1'b0, cin_b[3:2]} + c_out_t1, sum_out_t1};
% Z* \# A) C, }1 D end
" c: l0 q! `" m1 s5 P # J6 v9 f8 u3 t( M6 z$ a/ a
always @(posedge clk) begin
8 C; o+ }5 n$ p+ O, W0 } {c_out_t3, sum_out_t3} = {{1'b0, cin_a[5:4]} + {1'b0, cin_b[5:4]} + c_out_t2, sum_out_t2};
* H4 H" P o, Q* m4 K end
' ^; L Q" c. A: Z
+ s( R* s6 h' F9 {# T Q: e always @(posedge clk) begin
7 E; }" f* g6 S {c_out, sum_out} = {{1'b0, cin_a[7:6]} + {1'b0, cin_b[7:6]} + c_out_t3, sum_out_t3};8 ^' ^7 q$ L4 {# L# B" M
end! u( _! E4 f6 }& `) z6 d
6 ?% ~4 v$ r4 a: s3 w% ?9 N7 z7 B- E: O3 K; j" d6 G9 h6 {6 `% C
endmodule
: T! z; Q' `) [5 Y8 n0 z总结:利用流水线的设计方法,可大大提高系统的工作速度。这种方法可广泛运用于各种设计,特别是大型的、对速度要求较高的系统设计。虽然采用流水线会增大资源的使用,但是它可降低寄存器间的传播延时,保证系统维持高的系统时钟速度。在实际应用中,考虑到资源的使用和速度的要求,可以根据实际情况来选择流水线的级数以满足设计需要。' \& T+ h3 r- w# X- f2 K6 X
这是一种典型的以面积换速度的设计方法。这里的“面积”主要是指设计所占用的FPGA逻辑资源数目,即利用所消耗的触发器(FF)和查找表(LUT)来衡量。“速度”是指在芯片上稳定运行时所能达到的最高频率。面积和速度这两个指标始终贯穿着FPGA的设计,是设计质量评价的最终标准。 * E3 q' s1 B x+ j8 b
|