找回密码
 注册
关于网站域名变更的通知
查看: 242|回复: 3
打印 上一主题 下一主题

专⽤数据处理器(DPU)技术⽩⽪书5:DPU业界产品概要介绍

  [复制链接]

该用户从未签到

跳转到指定楼层
1#
发表于 2022-6-17 10:46 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您登录!

您需要 登录 才可以下载或查看,没有帐号?注册

x
1. NVIDIA BlueField# H( W! ]* C! j4 p" m5 x
NVIDIA推出的BlueField系列DPU,在支持网络处理、安全和存储功能的同时,实现网络虚拟化、硬件资源池化等基础设施层服务。BlueField DPU既是一个承担高带宽(100Gbs/200Gbs/400Gbs)的网络处理器,同时也是一个独立的 嵌入式处理器,它管理着众多加速器引擎,比如加密解密、正则表达式匹配以 及存储加速等等。BlueField DPU也可以通过ARM核运行嵌入式linux系统,处理一定控制面的任务,具有一定的通用能力。! w0 y% I- s% F5 d9 A, Y& R) T1 e
BlueField DPU 可加速数据中心常用的 SDN 、NFV、 OVS、Overlay 网络(例如 VXLAN)、网络地址转换 (NAT)、自动负载平衡、细粒度流量管理和内容分发网络。DPU支持网络包处理语言P4,提供DPU数据路径加速器中的编程能力。将这些需要占用CPU资源的网络处理卸载到DPU中,使释放后的CPU资源注重用户业务处理。6 z5 k1 l7 K" |* U' T& |
BlueField DPU将存储与计算隔离,支持加速软件定义的弹性存储、NVMe over Fabrics、分布式纠错和数据压缩。DPU 实现NVMe SNAP 技术可向主机提 供远程块存储,等同于本地 NVMe 块存储,具有低延迟、高吞吐量和高 IOPS等特性。
+ I5 O9 l& p. z  K' iBlueField DPU通过硬件卸载实现安全服务,其中包括防火墙、微分段、使用透明IPSec和TLS进行动态数据在线加密以及入侵保护。对于基础设施层管理,与在每台服务器上运行代理的传统管理不同,BlueField DPU通过Netflow等方式,可以监测到网络流量的变化,分析网络拥塞原因等。DPU通过这些方式,增加CPU用于业务处理的时间,实现对服务器的管理。
: G/ T/ F/ _7 [! u% _+ [/ k
. A& r1 N! F  i4 ]7 o  V& x* P1.1. BlueField 系列硬件架构& ~5 ~: ^, s: o1 w+ ^
NVIDIA 2020年推出BlueField-2系列 DPU,并计划在2022年推出性能更强的 BlueField-3 DPU。
. K( u. i8 e1 o 0 a" S% [- E  X4 R9 O6 t  l5 ~
BlueField-2 DPU具有ConnectX-6的网络处理功能,可支持高速以太网(200Gb/s)或 InfiniBand两种接口, 八个ARM核,高带宽DRAM和PCIe交换机,通过高速Mesh网络连接在一起。包含支持网络、存储、加密、流媒体等计算的专用加速器,同时具有面向安全、虚拟化、硬件隔离和远程管理的功能。; F& u+ y2 y# e( G
BlueField-2X DPU相比于BlueField-2 DPU,增加了对AI功能的支持,融合NVIDIA Ampere 架构的GPU并行处理能力与BlueField-2 DPU的数据处理能力。BlueField-3 DPU是第三代NVIDIA DPU。与BlueField-2 DPU相比,设计支持400Gb/s以太网或NDR InfiniBand网络连接,也可以卸载、加速和隔离软件定义的网络、存储、安全和管理功能,从而提高数据中心的性能、效率和安全性。' n% @; b9 k* v( A1 `
BlueField-3 架构图:. q6 q2 t! P& C  ?3 {: O
) a" ^! ~/ K9 h  t  b& t9 U
' g& |: u6 j! I: y" F. _
1.2.DOCA软件栈9 V* M- F7 }- M6 D
NVIDIA提供专用软件开发平台DOCA,支持使用行业标准API在BlueField 系列DPU上快速创建网络、存储、安全、管理以及AI HPC等应用和服务。利用DOCA可以使编程过程忽略硬件细节,同时保证兼容性。通过软硬件协同,发挥DPU的性能优势。
5 D) u. W2 Q/ C; f5 V- s( C6 W在 DOCA 和 DPU上开发的应用程序会将数据中心基础服务与应用程序隔离开来(如图5-3所示),即卸载到DPU之中,使得 CPU 用于业务应用程序,提升应用程序的性能和效率。数据中心分能够划分为应用程序处理域以及一个独 立的数据中心基础设施服务域,实现功能隔离。例如,如果主机遭受入侵,安全控制代理与被入侵主机之间的隔离层可防止攻击扩散至整个数据中心。& n, j1 b* J$ T, Y
3 b9 A! B# F" i3 z
# s1 i' a$ }1 ^4 |2 @# ~; e6 {% T
2. Intel IPU(Mount Evans)
  n( h9 C& s4 y& c7 q8 S* \( ZIPU(Infrastructure Processing Unit)是一种具有强化加速和以太网连接的网络设备,可使用紧密耦合的专用可编程内核来加速和管理基础设施15。 IPU提供完整的基础设施卸载,并通过充当运行基础设施应用程序的主机的控制点来提供额外的安全层。通过使用IPU,可以从服务器卸载与运行基础设施任务相关的开销。云服务供应商(cloud service provider,CSP)软件在IPU本身上运行,而 租户的应用程序在服务器CPU上运行。这不仅释放了服务器上的资源,同时优化了整体性能,而且为CSP提供了一个单独且安全的控制点。
/ {8 E/ C7 k0 a- W$ i7 _IPU将基于硬件的数据路径(包括 FPGA)与处理器内核相结合,使得基础设施以硬件的速度处理,能够跟上不断提高的网络速度和软件实现控制平面功能的灵活性。IPU具有以下三个优势:基础设施功能和租户工作负载物理分离 允许用户完控制CPU;供应商可以将基础设施任务完全卸载给IPU,有助于提高CPU资源利用率,最大化收益;实现完全无磁盘服务器架构的云数据中心。' \1 W( p( f. X& G( N2 |
  \2 f2 t! O9 }& j
2.1. IPU硬件架构
3 p- J) k2 a* S+ f6 }& l+ M( @3 I随着基础设施和租户业务的物理分离,通过加速器可以有效地卸载基础设施功能,并将其转移到真正的无磁盘架构。Intel认为IPU将成为未来数据中心架构的核心组件,在2021年的Intel Architecture Day上,Intel推出了基于FPGA和ASIC的两种实现方式的产品。其中,Oak Springs Canyon和Arrow Creek是针对云 和通信的基于FPGA的IPU产品,Mount Evans是基于ASIC的IPU产品。目前,相 关产品的技术细节还未对外公布,仅简要概括其技术特点。& w4 Y" x" A2 m2 \+ \/ H
Oak Springs Canyon基于Agilex FPGA和Xeon-D CPU实现。其中,Agilex在功 耗、效率和性能方面是业界领先的FPGA,与基于Xeon的服务器级CPU协同工作,能够支持2x 100G的工作负载。同时,该款产品还围绕x86优化了软件生态系统,使用Intel OpenFPGA堆栈(是一个可扩展源可访问的软件和硬件基础设施堆栈)。Oak Springs Canyon符合下一阶段100G CSP部署的需求,具有一个加固的加密块,允许以线速率性能确保基础设施流量、存储和网络的安全。
8 G$ Y$ g3 P. c! ~% Z" [) sArrow Creek是一个基于Agilex FPGA和E810 100G以太网控制器的加速开发 平台。它建立在英特尔N3000 Pack的基础上,该Pack目前已部署在全球一些顶级通信服务提供商。Arrow Creek将帮助电信供应商提供灵活的加速工作负载,如 Juniper Contrail、OVS和SRv6。
6 C4 `9 T3 R+ F3 V& `; T2 \基于ASIC的IPU:
% ?0 B. ^$ N/ J2 q
, A" P9 |3 \& D6 ]Mount Evans是Intel第一颗基于ASIC的IPU,通过PCIe最高可以链接四个 Xeon处理器,并将其中的计算负载卸载至IPU中进行处理。Mount Evans具有Intel认为是该类中最好的包处理引擎,它支持大量现有用例,如vSwitch卸载、防火墙和虚拟路由,并为未来用例提供了重要的空间;通过扩展英特尔久经考验的高性能Optane NVMe控制器创建的,Mount Evans能够模拟NVMe设备;Intel与CSP合作伙伴共同创新推进下一代可靠的传输协议,以解决有损网络上的 长尾延迟问题。2 j/ B& T* [8 z
Mount Evans分为网络系统和计算系统。
+ G  Z3 h! V" I# a. o网络系统侧支持连接四台Xeons主机,带宽可达200Gb/s,利用ROCEv2技术实现RDMA协议;Intel的Optane衍生NVMe引擎将高性能NVMe设备公开给主机处理器,使基础设施提供商能够使用IPU来实现其存储协议,无论是通过Fabric的硬件加速NVMe还是计算系统的自定义软件后端;可编程包处理器为vSwitch卸载、防火墙、遥测功能等用例提供支持,同时可支持高达每秒2亿个包的性能;Mount Evans提供内联IPSec来保护通过网络发送的每个数据包。计算系统建立在使用N1 Ares核心的ARM Neoverse架构上,并配有由三个LPDDR4控制器支持的大型系统级缓存,支持基于QAT技术的后备加密和压缩引擎;通过双核管理处理器提供了一个到平台和编排层的接口,支持健壮的系统可管理性。
6 {3 ]" B0 N3 O1 T- N: C, b4 ~4 P6 s  B6 {' Q
2.2. 软件栈5 y: s6 K$ Z1 E) o  i- e3 t
第四章第三节中介绍了Intel提出的统一编程模型OneAPI,支持跨平台编程,如CPU、GPU、FPGA及专用加速器等硬件设备。截止目前披露的技术信 息,Intel没有针对DPU提出专门的软件栈,但已实现对P4语言、DPDK等功能的软件支持。利用收购Barefoot获得的技术许可,Intel推重了P4语言在业内的使用,并作为将网络数据平面编程集成到IPU上的标准框架,提高硬件的灵活性和可编程性。Intel还将扩展DPDK和SPDK等软件开发工具包,以利用IPU的数据和存储处理能力。
2 o! }6 U4 I; h$ t* f0 D/ J$ j" j1 [- W8 [
3. Marvell OCTEON4 s, @+ G1 o/ P2 T* e) t
2021年6月28日Marvell发布了基于5nm工艺的OCTEON 10系列DPU,搭载了算力强劲的ARM Neoverse N2核,并且配备了多种硬件加速模块,包括加解密、 包处理及人工智能推理加速器(如图5-7所示)6。同时为了提供用户友好的可编 程接口,提高应用开发效率,Marvell配套硬件设计了包括DPDK、Marvell MLtoolchain等在内的软件开发平台。
) C& V  s0 x$ _* Q0 R# J ( v7 Q, ^% C  C% q) U+ J
OCTEON 10子产品包括CN103,CN106,CN106S 和DPU 400,不同子产品间的主要区别在于集成的ARM Neoverse N2核数,核数越多,性能越强的同时功 耗也相对越大(不高于60W)。目前OCTEON 10 系列DPU产品形式主要为芯片及 其配套开发平台(如图5-8),开发平台预计于2021年第四季度面世。四款子产品仅公布了其核心技术特征,具体产品细节及形式尚未披露。: q8 Z  E8 H; O6 C

该用户从未签到

2#
发表于 2022-6-17 13:10 | 只看该作者
学一下。嘿嘿

该用户从未签到

3#
发表于 2022-6-17 14:33 | 只看该作者
学一学。嘿嘿

该用户从未签到

4#
发表于 2022-6-17 17:37 | 只看该作者
66666666666666666
- a* K& l  R1 p( r0 c; m
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

推荐内容上一条 /1 下一条

EDA365公众号

关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

GMT+8, 2025-7-23 07:58 , Processed in 0.125000 second(s), 27 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表