|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
日前,国际TOP500组织发布新一期全球超级计算机500强榜单。中国超算“神威·太湖之光”与“天河二号”连续第三次占据榜单前两位,美国超算“泰坦”则被瑞士的“代恩特峰”挤到第四。这是20年来美国首次跌出前三名。" |& R3 f2 j5 r
/ P% ^6 E$ `- j9 D% g% \美国能源部近日宣布,将在未来3年拨给6家科技公司总额2.58亿美元的资金,以加速下一代超级计算机技术的研制,目标是到2021年交付至少一台每秒可进行百亿亿次计算的超级计算机系统。科工力量就此专访了中国计算机学会高性能计算专业委员会秘书长、国家超算济南中心主任张云泉,解读美国为何跌出TOP500前三,以及中美超算未来的发展。
- b0 X5 o1 t) y! ^5 Q" `# k) d8 }' ~/ d' E5 N, k' O, B
科工力量:这次瑞士的“代恩特峰”超越美国的“泰坦”,美国超算跌出TOP500前三,对于这件事您怎么看?到底是美国超算技术逐渐跟不上时代了,还是另有原因?
& l- d6 ]) U8 j: J& C( }# q( d" Z! M" \# ]9 l& b4 y
张云泉:这应该是一个大的周期吧,中国超算发展最好的时期,正好恰逢美国超算发展的低谷,这两个叠加在一块。显得中国很强,美国很弱。这是中国超算这几年发展较快的一个延续,中国最好的机器刚好在这个时间段。美国的机器布局太晚了,打了一个时间差。这也是国际超算发展经常出现的现象。: w( I) L3 J9 G: C1 R5 O6 s# h# j1 S
) a/ B. q. [+ l7 W
另外,美国在明年下半年会强力反弹,会拿出180P的机器,超越太湖之光。而中国将来要超越美国的这台机器,也要一个周期。
1 |2 E; i' E$ L1 B
: _1 V* H! ]: n/ J' Y" q+ [% z) }. H
代恩特峰; Q9 L P$ A) W! G" |3 s
8 h: S6 N' f* d8 t9 r2 _ G3 F3 @
% A: j9 K8 `+ j
科工力量:美国有诸多科技公司的技术很强,比如Intel、IBM、英伟达、AMD等,到底是什么原因导致美国的超算落后了?7 S! d7 R" z. ^4 X9 {
2 P; }, [2 ^3 y3 @( f1 y6 E张云泉:美国超算技术依然非常强,也有能力研发更强的超算,只不过美国研制计划落后,使得中国可以打一个时间差,后来居上。从美国的计划来看,在明年下半年公布的下一代超算会采用很多新技术。比如全闪存技术、最新Power处理器、三维存储、克雷公司动态超算结构等等。美国下一代180P超算上会有很多中国超算上没有的技术。$ [# }, U8 L8 K7 X$ L5 P
/ y. p8 e) a& E
科工力量:“代恩特峰”在芯片上采用了Intel的Xeon E5-2690v3和英伟达的NVIDIA Tesla P100 ,加上美国克雷公司在其中扮演了关键作用,有观点认为,“代恩特峰”其实是名为瑞士打造,但实为美国技术的超算。对这种观点您怎么看?
+ \8 K7 j# |$ k! T' W
/ R2 A T4 N3 |+ e9 M' a张云泉:这个确实是美国为瑞士打造的。主要是因为欧洲的超算研制能力比较弱,一直用美国和日本的超算。除了法国稍微独立一些,能够研制自己的超算。由于欧洲市场很大,中国超算公司会打进欧洲,联想、浪潮、华为、曙光现在都在做这个事情,已经签了不少合同,将来可以看到欧洲用中国的超算做应用。
) K) b9 Y) @" T5 _- g; X, i8 {# M! Y6 Y$ _ e: T6 I
科工力量:欧洲超算制造能力相对一般,但超算应用能力却着实不弱,而中国近年来在超算制造能力上取得长足的进步,但在应用方面,虽然也有应用取得了戈登贝尔奖,但总体而言,和中国的超算制造能力相比,还是逊色一筹。这其中的原因何在?
5 T+ A/ J J# c& e" J$ m c5 L6 y% M) S5 U
张云泉:欧洲超算的应用水平是比较强的,总体来说,中国超算应用水平还是比欧洲稍逊一筹。欧洲的商业化应用特别强,原因在于欧洲的超算制造能力弱,主要精力放在怎么把买来的超算尽可能用好。而且一直以来重视商业模式,超算都是很多大公司联合购买,因为公司花钱买了超算,有动力去充分挖掘超算潜能,把超算用好。
3 U% U1 [. U4 r% ^6 S+ v
% _6 n R6 A+ ]这方面对于中国也是有借鉴意义的。
: _8 G/ @7 D) h- H+ J# |
# @: \; _: P2 N* @$ J科工力量:一直有网络舆论声称,美国不制造100P超算是因为美国够用就好,而中国为了夺第一,所以制造高性能超算。您对这种说法怎么看?8 x C7 W4 B, R7 H" A% d
+ W+ ]5 v" ]" e# x5 P张云泉:从历史上看,美国也一直追求性能,在有一段时间,美国和日本超算争霸,日本的地球模拟器曾经连续5次拿了冠军。美国就紧急拨款投资建设了蓝色基因。因此美国也是一直追求性能的,并不是说够用就好。
1 L+ P! ^' v4 ?0 m" ?' G9 ?# a/ X- L/ s3 h" K
科工力量:美国的这一计划是不是驳斥了网络上一些人说的“因为现有的超算性能够用,所以美国不需要比拼超算”?
! O9 i/ F ~8 v& D$ a
1 P4 v" }/ Z) t! T% y" V4 L张云泉:超算的性能是永远不够用的,学科需求、计算的精度和规模是无止境地向前发展,我们现在超算的性能是无法满足使用的。往往是超算应用降低精度要求、规模要求来配套现在超算的性能。
' D+ O2 j' P0 ~' g4 x) R
& w1 H ~# |0 P/ R7 m7 G8 D M
' a; {5 h5 d' i# U( S8 x国家计算流体力学实验室基于“神威·太湖之光”超级计算机,对“天宫一号”飞行器两舱简化外形陨落飞行绕流状态大规模并行模拟
9 z1 v8 W/ B% J# H' L- |- r5 z1 P6 Y& _4 o7 S
其实美国一直想把第一抢回去。奥巴马在下台前就发过总统令,只不过因为当时发总统令的时候快下台了,作用有限,本来3个月就应该做好的事情,结果1年才做完。川普虽然砍了很多科研经费和医疗方面的钱,但他没砍超算的钱,反而给超算增加钱。3 g& [3 A |( ~2 c+ q; n! l) h& P H
5 P3 P. W7 P; u1 I; p
这其实也可以看出超算的重要性。: G# i/ z% }3 X
) `6 ^! Q8 t# s8 P* K/ s科工力量:美国政府资助国际商用机器公司、超威半导体公司、克雷公司、惠普公司、英特尔公司和英伟达公司开发下一代1000P超算,而且美国在下一代超级计算机技术方面的研发总投资将达到至少4.3亿美元。对于美国1000P超算的发展,您怎么看?
* n* N6 i# s. \7 A( L9 q# z0 v. O4 V# Q. F! b' O" E
张云泉:超算是国家工程,计算机技术发展的龙头,需要的资金投入非常高。之前已经介绍了,超算非常重要,所以会有政府高额投资。很多技术都是现在超算里做出来,然后再民用化。而且超算研发回报也很高,投入一美元,可以获得十几美元,只不过回报周期会长一些,而且风险比较高。
. K$ C* ]% |: f% Y {
6 u0 S! U* \9 O' e$ F+ R. |; E科工力量:从媒体报道看,美国政府承担了1000P超算的60%研发成本,国际商用机器公司、超威半导体公司、克雷公司、惠普公司、英特尔公司和英伟达公司大约承担40%的项目经费。为何超算项目如此依赖政府资金投入?8 t0 ~' |& n, }7 `: a" S
+ k# A: `8 n& s2 n& [张云泉:超算的发展一定要政府投入,体现国家综合国力,仅仅靠公司创新去做,公司的动力不大,因为公司不会考虑国家战略需求。而且超算研发风险很大,一旦失败损失很大,这对于公司和股东都是非常不利的。所以世界各国超算都是政府主导,政府牵头,委托公司来做。美国的做法是政府投入60%,公司也投入一部分。而中国现在还是以政府投入为主,怎么把公司的财力用起来,这个其实也是中国可以借鉴的。: m0 A- t1 {) ]
U" j, }# ?/ `. a. Q
科工力量:神威太湖之光采用了申威26010芯片,下一代中国1000P超算还会采用国内单位自主研发的芯片么?9 A: j" k2 H3 H8 _% H$ \1 y8 w$ J/ ]. b
1 p9 ]; E4 m: g- L& q3 F
张云泉:三台1000P超算原型机用的都是自主芯片。神威会用申威,曙光会用海光,天河会用飞腾。 \9 b& ~" h+ @" D
: I1 u/ n: i' W- Z0 c4 x! p8 z, u1 X c% w# S
一名研发工程师展示“神威太湖之光”所使用的“申威26010”众核处理器
3 L) u: e6 U! Y f5 i1 w0 E }/ ^: _& \$ l% K
5 f0 w/ A" g0 o" J8 m B, K8 f. R科工力量:中国计划在2020年左右建成1000P超算,美国也计划在2021年建成1000P超算,日本也有这方面的规划,对于中美日1000P超算竞赛,您怎么看?' @& K; x8 l% s1 R) v- ^% l
7 m, J# U% b7 s3 k6 P4 ?# F张云泉:现在中美日欧竞争都是白热化的。现在来看中国的规划最早,在2020年前后,日本、欧洲、美国都在往后推。日本已经推迟到2021年,欧洲推迟到2022年,美国推迟的更远到2023-2025年。
# M( r! j6 |/ v9 N: _/ X6 c3 M6 f$ g; t: T
但是美国部署了2条线,一条是成熟路线,用相对成熟的技术研发1000P超算,并保证商业应用。另一条是非常激进的1000P超算路线,不考虑任何商业目的和应用,任何能用的技术都用上去,争取在2021年抢第一。
. J6 c2 b6 d5 R$ M! q1 P6 H9 N' [
我估计中国的1000P超算也可能会延期,因为功耗的要求太苛刻了。当然也不排除中国能按照计划在2020年建成1000P超算。
8 C& x5 x7 l q# h2 f& X. x* ~' d* q# e6 J( p/ p
; i8 d; _3 F g$ A& ^$ z
|
|