找回密码
 注册
关于网站域名变更的通知
查看: 387|回复: 2
打印 上一主题 下一主题

ameya360:如何减少机器学习的碳足迹

[复制链接]

该用户从未签到

跳转到指定楼层
1#
发表于 2022-9-14 15:29 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您登录!

您需要 登录 才可以下载或查看,没有帐号?注册

x
  根据去年在IEEESpectrum上发布的《深度学习受益递减》一文中提到,随着机器学习的发展,到了2025年,最强的深度学习系统在ImageNet数据集中进行物体识别时,错误率最高只有5%。但训练这样一个系统所需要的算力和能耗都是庞大的,更糟糕的是,其排放的二氧化碳将是纽约市一整个月的排放量。7 L/ O( t0 S$ x  R8 J# V

$ {" y( B7 w% s  E2 v   机器学习的碳排放可以被分为两种,一种是运营排放,也就是数据中心在运行机器学习硬件中产生的碳排放;第二种是整个生命周期内的排放,不仅包含运营排放,还包含了各个环节的碳排放,比如芯片制造、数据中心建造等等。考虑到后者涉及更加复杂的研究,所以大部分碳足迹的研究都集中在运营排放上。; ]! h7 v+ Z- O, b8 Y7 b4 `
* O1 {5 y$ t: e, x- }0 A9 q' s7 S+ @
  至于如何记录碳排放,这也很简单,只需要将训练/推理的时长x处理器数量x每个处理器的平均功耗xPUEx每千瓦时的二氧化碳排放即可。除了最后一项参数需要从数据中心那获取外,其他的数据基本都是公开,或取决于机器学习研究者自己的选择。0 }% `  q- a4 m/ r# a6 \

" N: r& c# c  M& N  如何减少机器学习的碳足迹: A0 g  E. T/ N: I9 c  D
6 s' {  d; @5 x& @7 B
  图灵奖得主、谷歌杰出工程师DavidPatterson教授对现有的机器学习的研究和工作提出了以下几点建议。首先,从模型开始着手,机器学习研究者需要继续开发效率更高的模型,比如谷歌去年发布的GLaM通用稀疏语言模型,相较GPT-3,它多出了7倍的参数,在自然语言推理等任务上都要优于GPT-3。但同样重要的是它的能耗和碳足迹指标,根据谷歌公布的数据,与使用V100的GPT-3相比,使用TPUv4的GLaM二氧化碳排放减少了14倍,可见模型对于碳足迹的影响。其次,在发布新模型的时候,他建议也把能耗和碳足迹这样的数据公开,这样有助于促进机器学习模型在质量上的良性竞争。
! t1 {/ K4 G! ?2 a+ z( j2 Q' Q
! s. _2 B6 ]3 u  接着是硬件,他指出我们需要像TPUv4或者A100GPU等,这类机器学习能效比更高的硬件。其实这一点反倒是最不需要担心的,这几乎是每个初创AI芯片公司都在尝试的做法,即便在峰值上不敌这些硬件,也绝对会在能效比上尽可能做大极致。0 M+ b8 N/ H0 A1 ^* W* x1 H/ ^
' @! p8 Q7 N6 E3 B9 ]+ y4 m$ s
  还有就是常见的能效衡量指标PUE,大型机器学习负载往往要在数据中心上运行,而要让数据中心的PUE接近1并不是一件简单的事。根据UptimeInstitute的统计,各家厂商旗下最大数据中心的年度PUE为1.57,就连我国工信部印发的《新型数据中心发展三年行动计划(2021-2023)》中提出的最终目标也只是将新建大型数据中心PUE降低至1.3以下。但好在新建的数据中心往往都不会只满足于这个目标,而是往1.1乃至1.06这样的指标推进。# z, {; y: @' U; I) |* s) _( T

( v# v' q) N) b, Z4 K9 F& E8 A  可这个指标并不是一个死数据,随着负载和用量的变动,PUE是在持续波动的,不少数据中心仅仅在建成时发布了能效指标,之后就再未公布过任何数据了。在这块做得最好的也还是谷歌,谷歌每年都会发布年度能效报告,将各个数据中心每个季度的PUE公布出来。+ J4 X5 I( g4 N2 f& t; X
: I4 x: i/ R- c& ~; {
  不过仅仅只有极低的PUE只能体现出高能耗比,DavidPatterson教授认为还必须一并公布每个地区数据中心的清洁能源占比。比如阿里巴巴首次发布的《2022阿里巴巴环境、社会和治理报告》中就提到了2021年,阿里巴巴在中国企业可再生能源购买者中排名第一,2022财年阿里云21.6%的电力来自清洁能源。! R/ Q, t  k9 J

7 \: j9 n1 y! b/ ^! M, g' y  在双碳目标的提出下,我国其实已经落实到了机器学习的硬件上,但在软件和碳足迹透明度这方面还有可以改善的空间。机器学习要想做到消耗更低的算力来实现更优的效果,就必须从各个环节做到节能减排。- E+ E/ l) N6 b4 l  t
- M. f8 g1 v& ~
  • TA的每日心情
    开心
    2025-8-12 15:15
  • 签到天数: 1145 天

    [LV.10]以坛为家III

    3#
    发表于 2022-9-15 13:12 | 只看该作者
    很好的东西,很是美味和独特,尝鲜下
    您需要登录后才可以回帖 登录 | 注册

    本版积分规则

    关闭

    推荐内容上一条 /1 下一条

    EDA365公众号

    关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

    GMT+8, 2025-8-18 10:40 , Processed in 0.125000 second(s), 26 queries , Gzip On.

    深圳市墨知创新科技有限公司

    地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

    快速回复 返回顶部 返回列表