原标题:智算中心建设火热,追“新”逐“绿”向前奔
今年政府工作报告提出,适度超前建设数字基础设施,加快形成全国一体化算力体系。面对新一轮科技革命、产业变革机遇和“东数西算”战略发展先机,近一段时间以来,全国多地纷纷出台有关算力中心建设相关内容。
江苏日前发布的《江苏省算力基础设施发展专项规划》(下称《规划》),是全国首个省级算力基础设施发展专项规划,明确到2025年全省在用总算力突破24百亿亿次,到2030年超过50百亿亿次,将建成南京、苏州2个国家级核心算力枢纽集群。
上线的算力被一抢而空
人工智能时代,算力是核心,是人工智能的“发动机”和核心驱动力。在数字经济时代,算力意味着培育更多新质生产力。
可以说,在数字经济时代,算力的能力,决定了“学霸”和“学渣”的区别。现代人工智能的深度学习技术,依赖包含数百万甚至数十亿参数的复杂神经网络模型。只有足够的算力才能使模型在合理的时间范围内完成对海量数据的学习。
事实上,强大的算力可以大幅缩短模型训练时间。在南京麒麟科创园的南京智能计算中心(下称“麒麟智算中心”)内,寒武纪应用于麒麟智算中心二期的最新芯片二期已基本建成,算力达到每秒180亿亿次(八进制整型),是现阶段长三角地区已投入运营的规模最大、算力最强的全国产化智算中心。
对“算力每秒180亿亿次”的能力,打个简单比方:假设全中国14亿人每秒钟执行一个“1+1=2”的计算,那么180亿亿次,需要14亿人口不眠不休地算上40年。
目前,麒麟智算中心二期吸引很多人工智能企业上门寻求合作。“上线的算力已被抢购一空。”该中心运营总监洪晨曦说,中心已打造了30多个大模型,为中国科学院计算所、中国科学技术大学、南京大学、智象未来(Hidream)等上百家科研院所、高校机构、创新企业提供算力服务,累计为企业降低成本超亿元,增加经济效益超10亿元。
同样,南京江北新区智算中心目前已经与300余家企业开展合作交流,完成国产算力迁移适配百余家,中心的算力资源已全部供应给企业、院校机构。
《规划》明确,江苏构建“2+N+X”算力网络梯次多元布局,提升算力面向长三角区域城市治理、社会民生、行业转型等领域的服务能级,持续增强算力对创新应用的支撑,打造长三角算力供给服务新高地。
与此同时,江苏还将逐步合理提升智能算力占比,支撑大模型算法创新升级,为省内经济社会发展提供普惠智算资源。到2030年,全省智能算力占比超过45%,智算中心数量突破20个,存储总量超过500EB。在应用赋能方面,多要素融合创新孵化至少50项创新应用,打造不少于80个算力产业应用推广案例,打造智算典型示范场景35个。
此外,绿色安全方面,《规划》要求可再生能源利用率达到25%以上。新建算力中心国产算力芯片使用占比达70%以上、国产存储使用占比达90%以上。
区域算力建设加速推进
2022年,我国启动“东数西算”工程,在全国打造八大算力枢纽节点建设。其中,长三角枢纽作为东部枢纽,主要处理工业互联网、金融证券、灾害预警、远程医疗、视频通话、人工智能推理等对网络要求较高的业务。
目前,长三角一体化示范区数据中心集群已取得全面建设。位于江苏吴江的全国一体化算力网络国家枢纽节点,将于本月底启用部分算力设施。
“目前,正在进行土建施工和1号楼的机电项目施工,预计月底首批300个机架将被点亮,进行试运营,11月底、12月初完成所有土建施工,明年初投入使用。”苏州电信网络建设部副主任陆杰表示。
在吴江布设的全国一体化算力网络国家枢纽节点,通过打通长三角与西部地区国家枢纽节点之间传输通道,提升省内、省际跨区域算力调度水平,降低算力使用成本和门槛,提升基础设施利用效能。
江苏全面落实“东数西算”发展战略,在长三角区域内构建算力资源“省内一体协同、辐射长三角全域”的新发展格局。《规划》提出,省内算力基础设施整体布局要形成“双核辐射、苏中聚集、苏北突破、全域协同”的发展格局。同时,探索区域算力合作新范式,形成“异地建设、本地使用”跨区域算力合作新模式。
值得一提的是,2024年2月5日,由无锡市大数据集团统筹,全市首笔异地算力调度交易完成,数商携200P智能算力汇入城市“算力池”。
目前,无锡市大数据集团持续推动智能算力统筹汇聚,高效完成算力供需调配,积极对接智能算力供需双方,目前已统筹包括主流算力和太初等国产算力在内的智能算力资源超1000P。
需求带动下,更多算力资源加速“入池”。盐城市4月中旬发布了《关于加快推进算力发展及应用的三年行动计划(2024-2026年)》,并征求意见。该行动计划提出,到2026年,盐城市智能算力规模达到平均规模以上,总算力中智算占比超八成以上。加快形成以黄海新区、盐南高新区为核心,多个边缘智算节点协同发展的“2+N”算力发展体系,有力保障大模型技术攻关、参数优化、赋能产业需要。
智算建设,催生节能新技术
目前,我国算力总规模居全球第二。据中国信通院测算,算力每投入1元,将带动3元至4元的GDP增长。算力“用得好”,对发展数字经济意义重大。
在智算领域,建立大规模计算集群已成为满足未来发展需求的关键。其中,千卡集群(指拥有数千个计算卡的集群)和万卡集群(指拥有超过一万个计算卡的集群)将是推动科技创新的重要基础设施。
中通服咨询设计研究院有限公司(下称“中通服”)参与八大算力枢纽节点各类项目300余个,覆盖通用算力、智能算力、超算算力等各类多元异构算力中心,涉及相关算力规模超10E。
中通服总经理朱强表示,人工智能依赖大模型,而基础大模型的训练需要庞大、高效的算力支持。这些大模型的训练和应用,不仅推动了自然语言处理、图像识别等领域的技术进步,也为医疗健康、智慧城市、智能制造等多个行业的数字化转型提供了强大动力。
“同时,对智算的需求不仅限于提供算力,还包括优化模型训练和推理的能源效率和成本效率。智算需要实现高效的数据处理和存储解决方案,以减少能源消耗和运营成本。”朱强表示,随着算力需求的不断增长,对智算数据中心的建设和优化也提出了更高要求。
能耗,是智算中心建设过程中的一个重要问题。最近,中国电信在上海临港新片区启用的天翼云上海临港国产万卡算力池,是国内首个国产单池万卡液冷算力集群,也展示了国产算力的进步和对大规模数据处理的能力。
“针对能耗需求,我们采用了液冷技术,不仅提高了能效,也符合绿色低碳的发展要求,这种技术的应用,将在未来的智算集群中发挥越来越重要的作用。”朱强说。
据悉,在智算中心建设方面,移动云在长三角、京津冀、粤港澳大湾区、成渝、贵州、内蒙古、宁夏、黑龙江、湖北、山东等地投产首批12个智算中心节点,算力规模达11EFLOPS(FP16),实现“东数西算”枢纽节点基本覆盖。
其中,移动云在上海、江苏(南京)、浙江(杭州)等3省市智算中心合计提供1.9EFLOPS(FP16)智能算力。“面向AI大模型应用全场景,构建全栈智算产品服务能力,提供高性能基础设施,一站式训推智算平台,丰富的大模型服务生态,赋能AI+应用,加速各行业大模型业务落地。”中国移动云能力中心技术专家徐永田表示。
移动云不断强化绿色节能技术应用,自带“双碳”基因的自研全解耦液冷云计算业务交付上线。液冷机房散热能耗降低超50%,数据中心PUE值降至1.2以下节约空调电费超50%,提高服务器算力5%—10%。
盐城提出,依托当地“绿电+冷能”资源,打造长三角绿色算力成本洼地——探索构建源、网、荷、储的绿色高效算力能源供给体系,统筹储能电站建设,推动算力中心绿电直供,不断提高绿电消费比例,降低绿电使用成本,推广整机柜服务器、AI服务器、液冷服务器等高效IT设备,探索应用自然冷源电力模块、液冷等节能新技术。