海量计算任务背后,科技公司的“减碳路”要寻求新解法 蚂蚁集团何征宇:双十一背后的技术减碳,有一招“绿色计算”的杀手锏 ...

2022-5-8 12:41 来源: 36氪 |作者: 邓咏仪

在元宇宙、5G等趋势下,科技公司的算力需求还会指数级上升,这意味着巨量的能源消耗。在本期「谈碳」里,何征宇针对蚂蚁集团的“技术减排”构想、落地、以及商业化前景,分享了这几年的故事和经验。

和大多互联网科技公司相似,“双碳”大潮来临时,蚂蚁集团面临这样一道考题:自身业务没什么高额碳排放,想减碳的话,从哪减?怎么减?

何征宇就接到了这道命题。

何征宇有着标准学霸模板的履历:15 岁考取北京理工大学,博士毕业于佐治亚理工学院,后供职于谷歌内核组,创立并带领开源项目 gVisor ,成为基础技术领域里的新星。

2018 年,何征宇回国加入蚂蚁集团,第一项工作就是蚂蚁集团技术架构升级项目。他带头建立起的“可信原生技术部”,专攻基础设施技术,其中第一个目标就是通过技术架构的升级,更合理的分配计算资源,提升蚂蚁基础设施的整体运行效率。

到了 2020 年,国家宣布“碳达峰、碳中和”目标,包括何征宇团队在内的蚂蚁集团“绿色计算”相关团队,将  2019 年至今的工作更完整梳理了一遍,从而确定了碳中和行动路线。如今,何征宇任职蚂蚁集团可信原生事业部总裁、蚂蚁集团基础设施委员会主席。

用 IT 的手段节能降碳,业内已有先例。“绿色计算”就是业界基于这一问题提出的新概念。虽尚无明确定义,但业界普遍认为,绿色计算的核心就是提高资源利用效率。

在具体实践上,绿色计算主要分为两个方面:在物理层面,降低数据中心 PUE(核心能耗指标,即数据中心总能耗/ IT 设备能耗);在算力层面,合理分配计算资源。

何征宇麾下的可信原生技术部中多项自研技术,就和数据库、技术风险部门的研究成果一起,被归集到“绿色计算”体系中。2021 年双十一期间,“绿色计算技术体系”首次大规模应用在阿里巴巴电商业务中——蚂蚁的计算资源会变成“潮汐车道”,计算资源按时间段分配给不同的任务。比如,中午饭点是闲时,计算资源可以分配给实时性要求不高的操作;但在晚上零点,计算资源就可以全力支援付款下单高峰期,资源腾挪的时间可从原来的几个小时降到一分钟左右。

一份计算资源在不同时间段提供给不同的操作任务,极大提高计算资源利用效率。去年一场双十一下来,绿色计算让蚂蚁节省了 64 万度电,相当于 820 个人的全年生活用电;减排二氧化碳 394 吨,相当于 3 万辆燃油车停开一天。

2021年蚂蚁集团双11减排报告

而同比三年前,蚂蚁集团的服务器利用率提高超过 2 倍,相当于同等规模业务下,每一份算力的耗电量减少了一半。

能在短时间内达到这样的减排效果,蚂蚁 2019 年架构升级的每一步,都不可缺少。

“过去三年,蚂蚁的技术架构升级主要做了两件事,首先是将业务搬到云原生架构上;第二是建立了统一的调度中心,用来调度所有计算资源。”何征宇对 36 碳回忆。

此前,蚂蚁已完成业务上云,首先满足的是让业务软件搬到云上,在云上“可用”。等到业务进入高速发展阶段,内部的计算资源分散在不同地方,比如业务、AI 等算力需求较大的部门都拥有自己的技术栈,重复造轮子的问题日益明显。

所以,选择升级到云原生架构,相当于将底层的操作环境推倒重来,基于云进行重构系统,保证安全可信。开发人员不用再像以前一样,将软件开发好了再部署到云上,而是从研发开始就直接在云上协作。

在此基础上,可信原生技术部研发的核心技术,让计算效率显著提高。蚂蚁自研的安全容器技术,就类似于让来自安卓和 IOS 终端的计算任务,同时存在于同一个环境里,隔离好,让两个任务独立运行。即使 CPU 负载超过 95% ,计算效率也很少受到影响。

技术减排背后,蚂蚁集团的组织机制和调整也提供了保障。

从组织机制上,每一年,蚂蚁集团内部首先通过财务原则来管控,每年都根据上一年的资源实际使用情况来制定当年的预算。之后,业务和技术再根据需求,确定今年的技术投入和减排目标。

通过升级云原生架构,蚂蚁也将算力的分配统一归到了 CTO 线,并且成立了类似可信原生技术部这样的部门,攻坚相关的基础设施技术。

“以前,一些算力需求比较大的部门会拥有自己的技术栈和服务器,这就肯定容易有资源闲置。云原生化后,蚂蚁将算力统一归到 CTO 线进行调配,技术上减少了很多损耗,才有可能做到绿色计算。”何征宇告诉36 碳。

放眼碳中和进程,如今距离国家宣布“双碳”目标不过短短一年多,科技巨头们的“减碳路”,刚刚开始。

“双碳”目标被提出后,腾讯在今年 2 月发布碳中和目标和行动路线,明确第一阶段的任务:在节能同时,加大绿电应用,以自研、投资的方式探索新技术路线和商业模式。华为则基于原有的 ICT 业务,在去年 6 月成立了“华为数字能源”,目前已经对外输出自家的绿色数据中心、基站等方案。

2021 年 3 月,蚂蚁公布了碳中和目标,承诺于 2030 年实现净零排放(范围一、二、三),并在 4 月公布了自家碳中和路线。

从路径上看,除了主流的降低数据中心 PUE 、采购绿电、投资绿色技术、碳汇抵消等手段,蚂蚁的碳中和排放路径更注重技术减排带来的效益——蚂蚁在今年的碳中和报告中,就特意提及了,绿色计算在 2021 年为蚂蚁减少了近 3 万吨碳。

目前,蚂蚁的绿色计算技术也在通过开源、免费开放专利、论文分享多种形式共享。其中具有弹性可伸缩能力的分布式数据库,先行一步走到商业化阶段—— OceanBase 数据库开始商业化,帮助有相应需求的客户达到增效节电的的效果。现在,OceanBase 已经服务超过 400 个客户。

可做的事情还有很多。何征宇表示,蚂蚁的目标,是要在 3 - 5 年内追上世界一流的减排实践。

国外科技巨头做碳中和都更早。谷歌早在 2007 年就宣布自身实现碳中和,此后陆续推出包括自研数据中心、Nest 恒温器节能电源等产品;在技术架构上,谷歌从存储到计算形成一体化底座,也让能耗大大减少。

到了 2021 年,谷歌甚至在净零排放的目标基础上更进一步做出承诺:到 2030 年,让数据中心“全天候使用无碳能源运营”, 这意味着运行的全生命周期里都需要采用绿色能源。

对于 3 - 5 年的目标,何征宇表示,蚂蚁主要押注在基础软件技术突破上。他认为,技术在绿色计算发挥的潜力远未被充分挖掘。

一个证明是,当前数据中心 PUE 降低快到达极限值,减排空间已经不太大;但通过计算资源合理调度,蚂蚁的资源利用率跟三年前比提升了两倍多,今年预期涨幅也相当可观。何征宇认为,技术减排的红利仍有很多,而基础技术研发普遍存在后发优势,接下来团队解决问题的速度会越来越快。

接下来,可信原生技术部的触角也在不断延展到新的领域——在今年,何征宇团队将会重点攻坚如存储资源池化的问题。“现在我们是将上层的算力做调度,但存储是更为底层、更难迁移的。一旦将计算和存储打通,业务操作效率将会有质的提升,这也会进一步减少能源消耗。我们今年的目标,是将资源利用率再提升15% 左右。”他对 36 碳表示。

以下为 36 碳与蚂蚁集团可信原生事业部总裁、蚂蚁集团基础设施委员会主席何征宇的对话内容,经编辑后发布:

本文导航

最新评论

碳市场行情进入碳行情频道
返回顶部