找回密码
 注册
关于网站域名变更的通知
查看: 3519|回复: 1
打印 上一主题 下一主题

[仿真讨论] 富士通首次公开下一代超极计算机主板,单位尺寸处理能力高达“京”的22倍

[复制链接]

该用户从未签到

跳转到指定楼层
1#
发表于 2014-5-24 11:13 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您登录!

您需要 登录 才可以下载或查看,没有帐号?注册

x
本帖最后由 stupid 于 2014-5-24 11:16 编辑 ( v8 G- [6 R! V7 o# D) m) @
7 s/ D# ^3 e, I8 ]/ c
富士通在东京举办的“富士通论坛2014”(5月15~16日)上公开了正在开发的下一代超级计算机主板,以及收纳该主板的2U(约9cm)高度机箱。这个高约9cm的机箱所容纳的处理能力为12TFLOPS左右,与两代前的超级计算机“京”的一台机柜(高约2m)相同。单位高度的处理能力约为“京”的22倍。& J) n) n$ {- b! A

2 [7 o6 [: [8 p9 k5 x       “京”的MPU为“SPARC64 VIIIfx”,运算能力为128GFLOPS。富士通2011年发布的新一代超级计算机“PRIMEHPC FX10”配备的是新一代MPU“SPARC64 IXfx”。该MPU的运算能力为236.5GFLOPS。目前正在开发的超级计算机的MPU为SPARC64 IXfx的新一代芯片。尽管名称尚未确定,但运算能力可达到约1TFLOPS。$ J7 X/ x5 N; }9 [

& V& w  g" e5 d& {左为机箱,右为主板。- t( n: t6 ^7 p" p6 B; M( ~
- L% x  A3 k! K/ t# w4 I
  Y& v# b& l' E2 R' q
与“京”的比较 富士通的介绍展板。
! `1 y  M# H$ H% H& R) ]( Z& q" Y3 `( b: l- G+ D! P
       在“京”上用于连接各处理器的“TOFU”互联芯片被内置在该MPU里。正在开发的下一代超级计算机主板上装有3个这种MPU。每个主板的运算能力约为3TFLOPS,一个2U机箱装有4块主板,其运算能力约为12TFLOPS。
  q' u* B5 ?: A1 G1 _) n
/ i$ \' A+ l0 u2 X       据富士通介绍,主板上每个MPU都配备8个DRAM模块。DRAM模块为美国美光科技(Micron Technology)公司的“Hybrid Memory Cube(HMC)”。HMC为纵向堆叠多个DRAM裸片、使用TSV(硅通孔)来连接的三维封装DRAM。截止目前,HMC的容量以及堆叠的DRAM裸片个数均未确定。通过将互联芯片内置于MPU以及使用HMC等措施,使主板布局变得十分简洁,水冷管的设置也较现行超级计算机有了大幅改善。
$ G8 K& f2 o7 `7 c% d% L7 x% F  N* N, Y9 H% b

" H% ?1 s6 O- Z' m& \, q2 }主板的概要 富士通的幻灯片。       
9 }" D7 Q; X+ t
6 v4 U- K- z' {9 m
( i5 H# q& w7 F; q# S- q/ T机箱等的概要 富士通的幻灯片。
6 I9 h4 b6 }* V9 f% J( t+ B. H       除了三维封装DRAM之外,富士通还在超级计算机上首次采用了光纤连接技术。各个机箱之间采用光纤连接。但主板上的部件与主板之间仍与原来一样为电信号连接。; }" l) x2 J( k* Q  {4 N
2 v' p% T0 j% b2 a' P
       富士通目前已经接到了此次公开的下一代计算机订单。订购方为日本独立行政法人宇宙航空研究开发机构(JAXA)。从JAXA获得订单的超级计算机的系统总体理论峰值性能将达到3.4PFLOPS。据富士通介绍,该系统将分阶段导入JAXA,计划2014年10月启动部分系统,2016年4月开始全面运行。

本帖被以下淘专辑推荐:

  • · 超算|主题: 1, 订阅: 0

该用户从未签到

2#
 楼主| 发表于 2014-6-30 16:21 | 只看该作者
本帖最后由 stupid 于 2014-6-30 16:33 编辑 1 E8 [  b  {5 Y$ y

% M2 c% Z& t9 s" O# ]# F/ ~( a- I. I富士通2014年6月23日在于德国举行的超级计算机国际会议“ISC'14”上,公布了现有超级计算机“PRIMEHPC FX10”的后续机型“Post-FX10(暂称)”的详情(照片1、2)。新机型目前正在通过实机测评其性能,预定2015年开始供货。- P" H2 C3 S  D
8 M/ k% f* n$ k9 s, U: c

7 e. z7 G& ^9 H  z  T照片1:Post-FX10的概要
3 [+ F6 a* L) K( v$ Y* B, [( N( X2 j- }9 s- x; D) H

  d9 s! X/ D$ j  @0 @8 h, x照片2:富士通公开的产品发展蓝图以及针对EXAFLOPS级超级计算机的研究开发
- @9 D, C/ p4 W3 B, k3 @* @       Post-FX10配备的新处理器“SPARC64 XIfx”有34个SPARC内核,其中32个用于计算,2个用来辅助OS和MPI等(照片3、4)。通过将SIMD运算电路的bit长度扩展至原来2倍的256bit,提高了单线程性能。每个处理器的运算性能约为1TFLOPS,相当于“京”的处理器的约8倍、现行机型的约4倍。
# L! \5 ^. p& F
6 v+ H+ @; H$ |/ Q- F2 E& G ; d; W" e& `# y- m2 y5 z
照片3:此次公开的“SPARC64 XIfx”的晶圆
1 w$ @1 R9 D; T  ~, k/ z2 M5 o+ U2 c. e1 [5 t- P8 ~. w

: b5 s. ~1 c$ R" C9 \" @照片4:配备34个SPARC内核,32个用于计算,2个用于辅助
, b  p/ v. U0 \) ?       每个处理器配备8个美光科技的大带宽HMC(Hybrid Memory Cube,照片5)。从这一点来看,可以说,与存储容量相比,Post-FX10更重视存储带宽。富士通没有公布存储容量和存储带宽的详情,但透露说“计划使B/F值(存储带宽与运算性能的比例)达到与京相同的水平”。
  Q* `; d3 A- w* H/ W( `; t  ]. Z% c; A% I* c

7 ^( L1 l- x6 }. f% w/ {% y照片5:“SPARC64 XIfx”的主板。每个板卡上配备3个处理器。每个处理器配备8个美光的HMC。
! @# s9 \! K1 g& e" X6 J& w       连接各处理器的“Tofu Interconnect 2”整合到了处理器中。每条链路的带宽为12.5GB/秒×2(双向),提高到了5GB/秒的京的2倍以上。# n; c  J! c1 {8 h; n. X6 C
! ?! `5 b' W6 W( Y4 X0 K
       Post-FX10的水冷机箱能在2U尺寸内配备12个节点(1个节点=1个处理器,照片6)。一台2U机箱的运算性能几乎等于京的一台机柜。机箱之间采用光纤连接。1 t6 M) C4 {2 x+ F
/ R" A* U$ g0 J1 |: a5 @

3 \& s& H' a* C6 L" ]3 C8 L( p. |  Q照片6:Post-FX10的水冷机箱。Post-FX10每台机柜可配备200多个节点
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

推荐内容上一条 /1 下一条

EDA365公众号

关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

GMT+8, 2025-7-10 00:09 , Processed in 0.140625 second(s), 29 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表