找回密码
 注册
关于网站域名变更的通知
查看: 2453|回复: 7
打印 上一主题 下一主题

FPGA三国志-第一篇/共四篇/不可不看的故事 !【转载】

[复制链接]
  • TA的每日心情
    擦汗
    2020-1-14 15:59
  • 签到天数: 1 天

    [LV.1]初来乍到

    跳转到指定楼层
    1#
    发表于 2008-11-12 18:35 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

    EDA365欢迎您登录!

    您需要 登录 才可以下载或查看,没有帐号?注册

    x
    FPGA三国志-第一篇/共四篇/不可不看的故事 !在这个论坛里,看到多数朋友在讨论技术问题。但是关乎产品结构的帖子相对来说很少。实际上,现在很多产品,包括FPGA产品在内,同质化的问题也同样存在。只是一个此消彼长的过程。但是它们产品结构的不同差异,对我们的设计还是有很多大影响。我很想就这个问题来个开篇。希望大家多拍砖0 S) t# l) Z$ D9 j- o! Z2 g
    ) p) F7 d$ k2 P2 [4 M7 v
    我们为什么应该对FPGA感兴趣?
    * J* z$ m  T5 F, k6 h& M, p' a- i: ]! f
    5 E: q& e, T( F) e! i( |首先FPGA是数字电路,尽管目前有加入所谓的ADC的功能的FPGA,但是,从主流上说, FPGA就是数字电路。 当然早期不同的公司都赋予了很多花里胡哨的名字。 PLD,EPLDcpld,SPLD,其实在原理上都大同小异。今天的FPGA主要有下列市场, 正是在这些市场的竞争和争夺中,由群雄争霸逐渐形成今天的三国鼎立的局面。
    $ W& {5 X+ V% U9 V4 a% ]. }8 H/ t$ N. y. z: ~/ ]% \4 \
    ASIC市场  Q( a0 F% j  f7 ^2 W% ~
       现在大家可以看到很多FPGA的设计正取代更多的ASIC
    - [+ m  u$ W  C9 ^- x8 V% P% nDSP市场1 F0 `" y0 v# h" {. Q
       目前主要是高端的DSP应用,今天内嵌DSP元素的FPGA,像Xilinx的Spartan3ADSP, CycloneIII,CycloneII,Stratix和Vertex等, 都可以比最快的DSP再快上个500到几千倍
    , O% s1 a2 Z' P  H3 W嵌入式CPU' ?9 H  o. T$ f( _% j# G( ?7 H6 s7 d
       这里说的是微控制器类型的处理器, 随着FPGA单位价格的不断下降, 例如, CycloneIII中的3C5这个最小身材的家伙也可以集成一个可选定的I/O的NiosII软核处理器。 因此做嵌入式控制应用的市场也成为FPGA的市场,在我写这段的时候, Altera公司也会近期举办一些SOPC的研讨会, 也许,我写完这个的时候, 有更多的人已经加入到了这个行列里来研究嵌入式在FPGA上的实现。
    $ K* T# @' M/ w! `2 [. q4 X: t$ Z8 G& @- }: c( x* C& Y$ `
    高速的通信接口  [- P2 d/ x# a( d3 y
    最早的FPGA应用主要是协议和物理层的通信, 例如:ArriaGX支持的接口有GbitEthernet,PCIE,RapidIO,所谓的高端FPGA就是带有多通道的高速Serdes的产品, 这样意味着很多设备可以集成很好的通信以及网络功能。
  • TA的每日心情
    擦汗
    2020-1-14 15:59
  • 签到天数: 1 天

    [LV.1]初来乍到

    2#
     楼主| 发表于 2008-11-12 18:36 | 只看该作者
    CPLD的时代我在12年前,偶然接触PLD,没有想到自己居然就在这个行当里安身下来。可是这个行业也的确是个飞速发展的行业,十多年过去后,从当初的接近十家主要供应商,到今天已经激烈搏杀后,只有差不多如论坛题目一样的,成为了今天三足鼎立的局面。想来想去,决定以这个名字作为论坛的主题。同时也和大家分享我多年来的一些经历和感受。
    1 ~% v$ E6 u! J  w; b- f# e8 n; E! N1 v, N( ^
    全局布线,ISP,PLD,宏单元机构,成为PLD市场必备的武器。8 K$ D6 L( L2 I5 c. t- @& Y: v3 b

    , h) B- L9 D+ lCPLD时代,进入我国最早的供应商是Lattice,那个时候,也不是每个行业都用的了这种产品。首先,软件是需要收费的。这个和今天你可以轻松下载到免费的版本有很大的不同。另外,不同的授权,也决定你能使用不同的产品规模和设计语言。
    & E" P2 E$ L& v
    $ S5 _1 u. x, m. D* D( E# A90年代中,是电信行业大发展的年代。同时也是专用应用领域大发展的时代。当时pld是解决一个逻辑粘连的功能。同时由于Lattice很早进入市场, 推广很成功。全局布线池的结构,对于布局布线要求不高。一度时间,很多大的通信企业,研究所,都很快成为Lattice的用户。但是,有句话说得好。“长江后浪推前浪,前浪死在沙滩上。”太早的成功也孕育着。安则危!
    & A; k8 k$ l, O3 Y+ Q& g1 s
    & o6 \/ ?: o- A4 x- u6 |  L0 n94年Altera已经有了一些用户。但是相对来说。还是很有局限性。另外过去的信息远远不可以与今天同日而语.   但是用过altera的工程师,已经为他的界面和功能留下了深刻的印象。96年是ALTERA在中国发力追赶的开始。当然,乱世出英雄。当时的代理商是一家香港的公司。他们很快找出这种集成电路最好的销售和支持模式。并且这种从大洋那边继承过来的方式,经过适当的改良,的确收到很好的效果。代理商有专门负责的现场应用工程师。 这种方式极大方便了设计者与供应商之间的信息交流。在推广初期是否有技术支持,变得非常重要。这个时期在整个中国市场上涌现出很多非常优秀的现场技术工程师。今天已经有很多人成为这个行业的领军人物。' K2 P- z  S% [. d0 E; Z
    6 t. G# p" {/ M5 F: \3 U
    Lattice首开ISP技术先河,也就是今天常说的在线可编程,给所有设计者带来很大的方便。芯片在电路板上,可以直接编程调试。不用每次拔插芯片,再通过紫外线来擦写要方便得多。这个时候,Lattice还是明显占有上风的。毕竟先入为主嘛。当时主要的型号集中在Lattice ispLSI1032, 1016, Altera的EPM7128E,不过Altera已经做好了准备,因为,Altera毕竟是pld的发明者。而且也是最早采用Windows平台的开发工具。在美国市场上占有先机。他不会轻易放弃这样一个市场! J; O, T. T# p& C
    ; Y8 P- B7 u# F' R& c- y# y3 l
    当时的应用在电信领域主要是将之前的74系列的一些单元进行集成。同时加入一些控制功能。不过这个时期的产品结构都是采用mc单元结构。每个mc实际上就是相当于32到36个与非门,以Altera EPM3032为例就是认为有32*30到256*30, 大致就是7000门左右,因此产品命名为MAX7000,但是当时的设计很多还在大量应用异步设计。因此,电路的结构如果能导致利用率的上升,将是更加有竞争力的表现。MC的结构就是采用 先组合,后时序多个时钟输入结构。Lattice是用4个宏单元一组。altera 采用8个一组。而且,altera在利用率上,稍微占有上风。同时Altera当时的maxplusII的良好界面。在97,98年的两年时间里,已经奠定在中国的基础。更深层次,Altera已经看到未来市场的需求,前面说到,成功太早有时候也不是好事。在MAX7000的铺垫下,Altera已经有了进攻Xilinx的武器,可Altera一致宣称那不是FPGA,换以一个更加中性的名字---CPLD(复杂可编程逻辑器件)。 那什么是Altera的武器呢。FLEX8000!他的出现是Altera奠定今天可以和xilinx平分秋色的基础。
    8 h' G4 b: a  b9 @$ G6 K- B
    3 v7 p7 i2 s8 N- {% b9 o. C/ I, d9 T+ p' K" F
    在1996,97年, 成都,西安多家做专业领域的公司和研究单位,也使用了一些Actel,Actel的产品和那个时候的Quicklogic来说,都是属于Antifuse的技术。 使用他的最大好处在当时就是有防止辐射,就是说在航空产品中可以用。 但是需要你认真的仿真。 如果你烧入进去设计, 就只能换下一片了。 而且为了烧断里面的熔丝, 第三方的编程器支持的也不多。 但是他们有些军用温度的产品。 还是在这个领域有不错的口碑。 2 P# o* J) Y+ B7 V$ Y& X! r

    9 Y: \( n' J3 `. f, H, i! M4 jActel当时的策略结构是, 基本上和他们现在的论调也非常一致, 就是精细颗粒, 所有的DFF,还是可以靠独立的门来搭建。 这个在他早先的A1020等产品系列上可以看到。 而且芯片上有一部分是组合逻辑区, 有一部分是时序逻辑区。 另外他们的软件也是多家EDA工具的组合。 特别是库的一致性不是特别通用。 2 o! W4 W5 i4 _9 ^% H

    6 n5 r" s3 _( uQuicklogic的产品是FPGA公司中最早嵌入Synplify的商家,而且他们的LE结构是基于Mux的,底层的layout也可以清晰看到路由,资源消耗。 输入法和库的建立很特别。 但是也存在上面的问题。产品好像是QLxxx的, 我还去应聘过一次这家公司, 因为他们最早采用Synplify。而且,当时我已经感觉Synplify和 雷昂纳多(拼写忘记了),以及exzampler??这个拼写也有问题。 我在做FAE的时候, 总是用这3个工具都综合一次, 看他们哪个强。 后来证明是对的。Sy是最平均的, 而且简单的优点傻瓜。 遗憾他也在今年被Synopsys收购了。 现在Quicklogic也专注一些细分市场。
  • TA的每日心情
    擦汗
    2020-1-14 15:59
  • 签到天数: 1 天

    [LV.1]初来乍到

    3#
     楼主| 发表于 2008-11-12 18:36 | 只看该作者
    为什么要这样的结构-先组合,后时序多个时钟输入随着科技的进步,有很多人已经忘记了很多细节,当然,我们也要遵循一个原则。难事做易,大事做细!就像朱熹说的--“问渠哪得清如许,为有源头活水来“,如果你不知道原理,碰到重要的问题,或者是设计的时候,即使成功,也是不知不觉成功,同样呢,也是不知不觉失败。
    ( @, r9 m4 s, A" u& Q  t) w3 y5 p, E2 Z( \5 Z) R
    拉回话题,当你设计一个扫描电路的时候,例如,你可以采用一个时钟,输入一个计数器,然后计数器的输出,再驱动一个译码器,这样你的电路就出来了。当然事情完成了一半。功能实现了,但是,有没有更好的办法。后者换句话说。有没有适合PLD的方法。实际上用另外一个角度看,这个设计是典型的, 先时序模块,才是组合电路。这个实际上,不是很和PLD本身的结构相符。还有一个问题时,随着电路速度的提高,每个译码输出之间的抖动也成为问题。就是输出的不一样的。 从资源的角度来说,一个计数器,要3各单元。一个译码器,由于有8个输出,还是需要8各单元。但是如果用一个移位寄存器的方式,可以只需要8个单元。或者用状态机的方式实现,也是消耗同样的资源。可是,输出都是由于同一个时钟锁定,每个输出的延迟也比较一致。另外,当时对总线数据的译码是经常有的事情,因此,每个单元的扇入数量都是很高的。都有30个以上。因此,你设计的时候,要有两个思想: 用同步设计模式,用先组合后时序的模式。后来的Xilinx的95系列更是将扇入系数扩大到90个。 也是这个原因。当时PLD厂商比较的也是这些指标。( `% w" R, `6 o7 ]

    $ A  B$ e% K: @7 `5 }+ Z  g1 m' Z当然我现在之所以又开始补充些内容,好像是一些网友提醒我说没有说Actel等产品, 现在不妨也加入一些。 但是为了这个话题, 我不得不再说些比这个看起来更久远的事情。
    * B- i9 _0 G9 {, h7 O0 m' ~7 m
    5 s+ M+ F# l5 {$ U; I7 H反熔丝的技术在PLD一出现的时候就有了, 最早的有所谓熔丝技术,实际上他们都只是初始状态的定义不同。 1970年的时候, 就有Harris公司, 今天叫intersil的公司, 就已经有这样的技术, 不好意思, 那个时候, 我还没有出生呢,但这丝毫不妨碍我们谈论他。 后来Intel公司也有EPROM的技术, 从PAL和GAL的发明也都和这些能拉上些关系。 这些技术之所以诞生就是要替换这个熔丝技术。 毋庸置疑的是,今天的以SRAM为基本的配置技术的FPGA成为了市场的领导。 这个是市场选择。
    % R' q0 ]; O; U; e" K6 Y) q! C5 ~
    5 g9 h9 {( u: S  yEPROM技术时代的PLD,例如Altera的MAX5000,但是这个东西的封装太贵, 这和以前你用的2716有些类似, 都是用个石英玻璃封装的, 擦除也不方便, 另外, 随着规模的递增, 有时候路由线可能影响透明照度, 所以规模大的器件,擦除的时间还长。
    4 H/ h$ s+ j  L6 y6 k
    # e+ C. X" j  L! e1 WSRAM是有很多优点, 但是他不保密, 不过今天表示半导体工艺的先进, 总是和SRAM的制造会扯上关系,而基于其他工艺的Flash的FPGA,在工艺制造上远不如SRAM的更新速度, 基本上可以差上一到两个工艺节点。 或许还有人认为, Flash的功耗小, 不要单独看这些, 这主要表现的是他的静态功耗上, 另外,为这些Flash的FPGA的编程, 也需要在芯片上放上很多编程Flash的单元, 他不能在成本上带来什么好处。
    % k1 ^. m+ u7 d* R( J5 t
    4 @5 b: q* j6 D5 @6 Y2 r4 v" M如果你在google上去搜索一些关于PLD的专利, 还有很多你今天都已经不存在的公司的名字。
  • TA的每日心情
    擦汗
    2020-1-14 15:59
  • 签到天数: 1 天

    [LV.1]初来乍到

    4#
     楼主| 发表于 2008-11-12 18:36 | 只看该作者
    Xilinx , FPGA的发明者Xilinx实际上成立的日期,比altera还晚了一年。但是他走的道路,从开始就注定了有今天的成就。在1996-1998,pld的高端市场,也就是FPGA市场,都是Xilinx把持,主要是xc3000/4000 ,当然Xilinx开创了一个新的结构,不过这种结构还是能够找到一些共同点,也是先组合,后时序。不过很重要的闪亮点是:
    8 ]' ?" L2 ]) s0 Y/ k# N* S细颗粒查找表结构,丰富的寄存器资源,以及分段式路由布线结构,电路上电加载。 当然如果这个也算是的话,那就是,他的内部甚至直接集成了三态门。这个特点是那个时代Xilinx拥趸攻击Altera,Lattice的重要工具。甚至有人说,没有这个不能实现某些电路设计的障碍。 当然了,Altera, Lattice的pld也是具有三态门,不过是在输入输出管脚上。的确是不如Xilinx的来的强大和直接。 有的人问了,这种结构有何好处。1 S4 z! G) u# M) |2 B% a; A! D
    1--电路的规模得到空前的提高。
    : ?) R; ?2 D1 Y  P% V8 @( T4 {8 f2--适合做加加减减的,counter,comparter密集的设计。
    ! s- @1 H9 J- f0 `3--无限制的更新电路。9 b5 o# R- Q" ]% K1 C

    0 d* b$ a4 t/ o- R& V在那个时代,衡量一个PLD很重要的指标,就是比谁的规模更大。从这个角度来看。Xilinx无疑走到了最前面。当然,也有人说, 这样的设计不可靠。这样的设计指标难以预测。还有地说这样的设计无法保密。但是市场的成功,应用需求的推动,证明这些都是杂音。4 r" R+ s- S& L! b. r

    7 `/ g* E: ^  ~1 r+ O+ U xc3000.JPG (53.89 KB)
    0 D/ q, w+ `" q6 L1998,Xilinx 3000 select guide
    ; a: Y+ r- n' {. A8 ]2008-9-22 20:14
    . u# V3 o8 }1 C/ N  S" `$ T, v
    5 p! s6 t, s, Z, o6 N& g( D  D
    7 `. a( T3 n" d( o3 k- L我们可以从当时xc3000的选型指南上看到。最大规模的产品,也就是今天xilinx最小的xc3s50a规模相当的东西。可是这个和当时PLD流行的规模,实在是一个飞跃。
  • TA的每日心情
    擦汗
    2020-1-14 15:59
  • 签到天数: 1 天

    [LV.1]初来乍到

    5#
     楼主| 发表于 2008-11-12 18:37 | 只看该作者
    Xilinx FPGA的架构。Xilinx的成功,激励了Altera的新产品的推出。同时也有了革命性的突破。世界就是这么奇怪。中国古语。塞翁失马,焉知非福。实际上,如下所言,这款产品因该8282,具有282个逻辑单元的。但是在中国基本上只是在1995年有个别公司使用。
    1992
    FLEX® 8000 FPGA
    Altera的第一款现场可编程门阵列(FPGA)
    $ X" s+ O. D, @- Q/ H4 c
    2 o9 j& f+ O; t! w! Q; O
    我本人经历我们开始在1997年开始大规模推广Flex10K, 同年5月,位于西安的邮电部4所,是第一个采用EPF10K50的用户,当时电子杂志的广告,也有表明,Altera最先推出最大的FPGA.
      G: h# h( v7 H/ z( `: @8 a/ {' d$ ?, H; o
    1996
    FLEX 10K® FPGA
    带有集成锁相环(PLL)的FPGA
    1 t2 ~8 J3 Y" c4 `, w
    1995
    FLEX 10K FPGA
    带有嵌入式模块RAM的FPGA 5 Q$ ^3 v8 [% f5 ^

    # ~9 ?( L6 e. X$ |# I. w7 b实际上,这个时间就是Lattice噩梦的开始,由于设计规模的迅速攀升,规模已经是决定一个产品的关键因素。但是Lattice一直没有代表作。市场份额已经开始逐步被Xilinx,Altera蚕食。Altera的结构到底是什么革新呢?
  • TA的每日心情
    擦汗
    2020-1-14 15:59
  • 签到天数: 1 天

    [LV.1]初来乍到

    6#
     楼主| 发表于 2008-11-12 18:38 | 只看该作者
    Altera FPGA粗颗粒结构,嵌入式存储器,长联线结构.Flex10K,他的推出,已经表明,altera的思维已经非常清晰, 大规模的fpga将会是将来的王道!而且,高速的嵌入式块RAM是一个开创新的思维。当时,Xilinx凭借分布式RAM以及内置三态的结构,的确大有横扫千军的架势。但是Flex10K的出现,有效提升了Altera的FPGA产品的竞争力。在RAM需求应用不断上升的市场中。Altera迎来了市场的春天。
    ( l1 b8 g0 M1 i% M  w
    * k/ H$ l( E, c" h! N, \1--采用多选一,或者一对多的MUX结构,Altera推出应用指南。直到用户有效利用这种方式,实现了三态门的功能。$ y. c0 z; M* _4 a0 r+ Q9 B% B: F
    2--ESB的memory结构,是构建FIFO, DPRAM,大型查找表,都非常方便,
    & g8 e% a, Y2 x- V  X" f0 ~! b/ A6 {3--布线资源相对来说,以长联线资源为主。编译速度快。
    4 T3 a& Y6 f# k. z! `9 E3 u+ J
    & B5 d/ Z8 p, @# oXilinx的分布式RAM尽管很灵活,但是随着RAM容量的增加,访问的速度也是递减。同时也要消耗大量的逻辑资源。这个时候,应该说Xilinx和Altera的产品已经是势均力敌。因为中国是新兴的市场。这一点表现得很明显.
    1 K" l1 z5 u7 y; l0 t5 h
    * T! g% b! R1 X9 _8 o+ Y9 x规模制胜的产物
    ) b* @, g# {5 a* Z- m8 M$ ^6 f0 O6 Y$ r5 E% z( {/ M& X9 v/ T
    / v  K* c; i+ e+ ]4 H% S, u
    世界是运动的,粗颗粒,也是好结构!这里又回到了我们的主题,产品的内在结构。先说细颗粒结构。当时,Xilinx的3000是以CLB为基本机构。
    + P5 m. K! }3 }' l8 M5 E; ` xc3000clb.JPG (35.32 KB)
    $ Y1 |; y( F5 C5 K% N2008-9-22 22:224 X  b9 b8 ^7 M, T# Q! }( s* @, k
    4 q% N6 R2 z7 [" a  p2 H
    % e8 _  k! m1 P1 `& u% L+ W1 O

    - _4 \; x8 P2 i实际上,这个输入的个数是很有讲究的。当时,也有一种激烈的争论,就是5输入的好,还是4输入的好。在实际应用中,应该说,最小的逻辑单元是这样的规模是合理的。但是要注意一点。Xilinx和Lattice后面推出的fpga一样,两个寄存器是具有同一个时钟输入的。; b, q1 {0 [' d- e

    5 W6 l3 u- L( J! J  \ flex10kstructure.JPG (57.46 KB)! o; g+ x  A) w2 K
    2008-9-22 22:51. b. v/ f0 N6 h& v) v) x

    / _" c4 c' q8 u, D2 i1 ]
    6 a; X, T4 n& a/ V
      o4 n& o% r. a4 k/ l+ x) r粗颗粒结构,Altera还是依托自己以前在PLD的经验的积累,他的fpga有很多他的pld产品的血统。世界是基于以权制利的。因为这个时候如果已经有了Wintel的名字一样。 数字电路以及CPU的发展,都和8以及8的倍数有关系。因此。这种大颗粒的结构确保:$ _# s% _" c% B8 [# _9 k
    1--8个逻辑单元LE为一组LAB。
    * W$ u- b5 f6 l3 o9 o7 x7 A- E2--每个LAB内部有独立的布线资源。确保可以实现8bit adder, shift reg, 8bit counter. ( a2 _+ V2 R4 I. Q# C% d
    3--ESB,实现了存储器的资源和速度同时提高的可能。
    * ^" S7 J3 O+ \0 F( i" i( {0 D4--布局布线算法比细颗粒机构的算法简单。# D: r4 {9 |# x- a7 a
    5--采用了非对称的结构,实现速度需求和控制需求的折衷。

    该用户从未签到

    7#
    发表于 2008-11-12 23:51 | 只看该作者

    回复 6# 的帖子

    三国在不久的将来就成为两国了。。

    该用户从未签到

    8#
    发表于 2008-11-13 10:56 | 只看该作者
    其实在EDACN中一直在看这个帖子只可惜大量的插楼让我看起来很费劲,今天版主能花费时间把它整理到这里,真的很感谢。
    您需要登录后才可以回帖 登录 | 注册

    本版积分规则

    关闭

    推荐内容上一条 /1 下一条

    EDA365公众号

    关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

    GMT+8, 2025-10-5 05:16 , Processed in 0.156250 second(s), 24 queries , Gzip On.

    深圳市墨知创新科技有限公司

    地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

    快速回复 返回顶部 返回列表