教育新视-"CHINAIN20YEARS."-HPC 2024:上半年建 140 个智算中心,CHINAIN20YEARS.但实际需求正在萎缩_ZAKER新闻

CHINAIN20YEARS.HPC 2024:上半年建 140 个智算中心,CHINAIN20YEARS.但实际需求正在萎缩_ZAKER新闻

CHINAIN20YEARS.HPC 2024:上半年建 140 个智算中心,CHINAIN20YEARS.但实际需求正在萎缩_ZAKER新闻

HPC 2024:上半年建 140 个智算中心,CHINAIN20YEARS.但实际需求正在萎缩_ZAKER新闻

  特别是加入世贸组织后,我国积极参与国际大循环,实现了市场和资源“两头在外”,形成“世界工厂”发展模式。经济外向度低的武汉,枢纽功能、城市地位也相对下降。

9 月 24 日至 26 日,第 20 届 CCF 全国高性能计算学术年会(CCF HPC China 2024)在武汉市中国光谷科技会展中心举行,主题为 " 华章廿载 新质未来 "。本届大会由 12 位院士领衔,携手了来自算力领域的 400 多位顶尖学者,进行学术交流和专题分享。值得一提的是,此次参会人数也创下历届新高,总数突破 4000 人。在当下的智算时代,面对软硬件兼容复杂、训练集群故障频发、可用算力效率不高、电力及空间限制等算力相关 " 卡脖子 " 的问题,多名业内大佬阐述了自身认知。在结合海内外发展的判断下,他们也先后展开了包括 " 高通量以太网 ( ETH+ ) "" 晶圆级变结构计算 "" 类脑算力 " 等在内多种解法的分享和探讨。值得一提的是,有关于全球市场中 " 算力的尽头是电力 " 的类似焦虑,在会上也出现了不同的声音——中国工程院院士邬江兴特别强调了 " 用电力拼算力 " 这一发展范式的不可持续。另外,AI 科技评论注意到,作为一年一度为超算、智算、数算等提供学术交流机会的平台,在今年的 CCF HPC 中," 超智融合 " 被一众大咖反复提及,成为本届大会最鲜明的特点。这也是在不少业内人士的预判中,未来解决国内计算瓶颈的重要路径。超算是可以用来训练 AI 的,而国内过往在超算领域的丰富经验积累,需要移植到智算领域中来,超算和智算走向融合已然成为大势所趋。这一趋势的出现,也标志着 HPC 由传统通用计算主导的科学计算,逐步过渡到了异构加速的 AI 计算新时代。需要关注的是,近年,对于 " 算力网 " 这一概念的呼声走高也同超智融合息息相关。这也是基于中美需求差异的洞察下,更为符合国内算力市场现状的解决方案之一。算力的瓶颈与破局之道当前,国内在算力集群之上已有不少千卡、万卡级别的实践,但要实现十万卡,甚至超万卡的突破仍颇具挑战性。国产算力究竟还有哪些 " 卡脖子 " 的问题?在此次 CCF HPC China 2024 上,业界大咖齐聚一堂对此作出讨论,与此同时,也带来了多种不同的解题思路。" 大算力需要大集群的扩展,但大集群并不一定能够提供大算力 ",高通量以太网联盟执行主席、中国科学院计算技术副研究院王展分析。" 今天基于并行的计算范式,对于每次的计算迭代来说,完成之后 GPU 之间都要通过全局参数和提督同步才能进行下一轮迭代,这种同步通信的特质决定了训练集群很强的‘木桶短板’效应,任何一点拥塞、故障,都会导致整个集群训练性能的损失或下降。"所以," 为了让大集群获得好的算力,提高算力的线性扩展度,需要做很多方面的优化工作,包括上面的算法、通讯框架、并行的计算模式,以及计算和网络协同,存储和网络的协同等等。" 他总结发现," 其中最核心的需求是需要一个稳定高性能的网络互联。"去年,大模型的兴起带动了算力需求的提升,而王展观察到," 彼时,许多头部互联网和云计算公司都还没有基于以太网成熟的解决方案,一时间业内唱衰以太网,认为只有 InfiniBand(IB)才可以提供高性能的网络互联。"发展至今年," 高通量以太网(ETH+)" 逐渐走向主流舞台,也在今年的大会上再度引来一波热议。而从海外巨头的动向来看,据王展透露,AMD 发布的 UALINK 联盟也或将改为以太网:" 目前,AMD 采用的是 Infinity Fabri(IF )的私有协议,在服务器内部是基于全互联,而它下一步的 GPU 一定是采用 Infinity Fabric Switch 放在服务的外部,这方面如何构建将成为行业重要风向标。"不过," 高通量以太网(ETH+)" 仅仅是解决思路之一,邬江兴给出的 " 答卷 " 则聚焦于 " 晶圆级变结构计算 "。在他看来,国内算力发展还有着以下难点:一是性能增长与算力需求的矛盾凸显;二是还原论模式导入带宽、时延和单位算力密度的插损;三是刚性计算架构造成总体效率低下;四是存储程序控制机理存在自在性安全矛盾。当前,晶上计算正成为大规模、低功耗、高密度、高性能计算系统主流,这一点从世界主流厂家的布局中可以窥见一斑——2019 年,美国 AI 芯片独角兽 Cerebras Systems 首推晶圆级处理器 WSE 系列挑战英伟达。2021 年,特斯拉也推出了晶圆级 Dojo 处理器,此外,也包括英特尔的 M2+ 晶圆级拼装、台积电的 TSMC-SoW 等等。 而和前述布局稍有不同的是,邬江兴讲述了 " 软件定义晶上系统(SDSoW)" 的新概念。他提出了一个 "SMV 困境定理 ",即现实技术物理环境在满足全生命周期可扩展性前提下,任何单一技术体制都不可能在 S、M、V 三维空间内同时达到最优,这也是当前国产算力发展之时,所面对的计算架构单一性与算力需求多样性的矛盾所在。针对这一 " 不可能三角 "," 变结构计算 " 则是关键突破点。据邬江兴介绍,变结构计算的第一性原理为软件定义的节点 + 互联,SDSoW 则是这一解法的物理实现载体。不同的算力处理特征适用场景各有差异,于是芯片也需要实现异构融合,这也同人脑处理任务具有相似之处。沿着这套逻辑," 类脑算力 " 的概念也成为当前业界前沿的思考之一。" 类脑处理器(BPU)更加接近生物脑信息处理特征,比较适用于一些密度比高的矩阵和稀疏矩阵,以及知识图谱、动力学方程的运算,处理非结构化随机排布的数据运算更有效率。" 中国科学院院士张旭如是说道。当前,在全球范围内均有类脑计算相关布局——去年年底,广东智能科学与技术研究院发布了天琴芯类脑晶圆计算芯片,今年 4 月,英特尔也发布了 Hala Point 大型神经拟态系统。不过,类脑芯片在功耗上能够占据一定优势的同时,对于成本问题,在业内仍有部分顾虑的声音存在。另外,值得一提的是,电力也是算力发展过程中屡屡被强调的关键一环。" 我在一年前预测过芯片短缺,而下一个短缺的将是电力,明年将没有足够的电力来运行所有芯片。" 特斯拉首席执行官埃隆 · 马斯克曾发表过这方面的担忧。无独有偶,此前,OpenAI 创始人山姆 · 奥特曼也曾提出类似警告:" 下一波生成型人工智能系统消耗的电力将远远超出预期,能源系统将难以应对,未来 AI 的技术取决于能源,我们需要更多的光伏和储能。"美国科技巨头们的焦虑尽显,海外研究机构曾有报告称,ChatGPT 每天要响应大约 2 亿个请求,在此过程中消耗超过 50 万度电力,这基本相当于 1.7 万个美国普通家庭的用电量。针对国内情况,邬江兴在会上对此发表了不同看法,他强调了 " 用电力拼算力 " 这一发展范式的不可持续。" 算力的极限不是电力,不应该是电力,电力支持不了算力的持续发展。" 邬江兴坚持认为。「超智融合」已成大势所趋今年以来," 超智融合 " 也已成为业界广泛认可的国内 HPC 新趋势,这一点在本次大会上体现尤为明显。" 超算是可以用来训练超大模型的 ",清华大学计算机系教授陈文光在演讲中提到," 过去,我国在超算上是有很好的基础的,那为什么到了智算时代,所有人都觉得我们落后了很多,是不是可以把超算领域的经验移植到智算领域里面来,通过‘超智融合’的方式。"他也在过往实践中验证了这一观点的可行性——" 我们在新神威计算机上研发了一个大模型训练框架叫‘ Bagualu ’,不过之前没有说要去超智融合,所以在双精度算力和半精度算力上面只做到了 1:4。但是如果这台机器能做到 1:16,用来做 AI 训练的话也会有一定竞争力。" 陈文光说道。他认为,超智融合或为解决国内算力瓶颈的重要路线:" 确实超算过去只有科学和工程计算作为主要的应用,面临商业用户相对来说是比较少的问题,如果能够做到很好的超智融合,也能给国产超级计算及的商业应用,提高整个的投资效率起到很好的作用。"并行科技董事长、CCF 副理事长陈健对于 " 超智融合 " 的趋势也有类似的感受。在他看来," 在 AI 的进化史中,较长时间内我们理解 AI 是 AI,超算是超算。但从去年开始,AI 的大模型训练需求暴涨,这是典型的并行计算应用,底层需要超级计算机,是以 GPU 为主的超级计算机。其实超算也并不是说只有 CPU 的超级计算机,我们去看 top500,70% 是英伟达和 AMD 的 GPU 搭建起来的超级计算机,主要的算力是由 GPU 来组成的。"自 " 百模大战 " 打响后,过去两年,业内不少实践发现,传统的基于云主机、虚拟化所搭建的云服务平台,面对大模型训练并不合适,而最关键的一点在于,没有解决卡与卡之间性能的问题,也就是超算中常用的带宽问题,或者说计算与通信的比例关系。陈健将当前大模型的算力需求总结为以下方面——超大规模大模型训练供不应求,包括微调在内的常规的大模型训练供大于求。对于常规大模型训练,目前看到的情况是:" 今年上半年大概有 140 多个智算中心在建,全国在规划中的共有 250 多个智算中心,这部分算力搭建出来之后,大概率是 2000 卡以下的集群,而现在这样的需求正在萎缩。"其中,关键原因在于两方面—— " 卷 " 基础大模型的厂商变少以及随着基础大模型版本的更新迭代,许多行业模型的存在价值正在消失。当前,业内有关 " 算力网 " 建设的呼吁,则是在对 " 超智融合 " 这一趋势的预判之下给出的解决方案,对此,大会现场也有不少相关讨论。国防科技大学院士王怀民介绍道," 超算与智算融合不仅体现在算力中心,还出现在更广泛范围内算力中心资源的有效连接和共享,所以我们都在呼唤中国算力网的出现。"这也是由中美需求上的差异所决定的,美国的算力主要集中在云服务商手里,通信运营商并没有很强的算力,也并没有强调建立算力网,而是利用分布式的系统和编程语言技术来解决云的孤立的问题。中国工程院院士李国杰以天空实验室为例介绍了美国的当前情况——"Spark 的发明人 Ion Stoica 组建了一个 SkyComputing 实验室,2022 年正式启动,主要是想解决云服务平台的孤岛问题,想要发展成一种公共服务。主要包括三层平台,兼容层隐藏云之间的差异,云间层寻找不同服务的最佳性价比,互惠对等层则主要实现免费和快速地在云间传输。"说回到国内,据李国杰观察,当前,由于在训练过程中需要频繁交换模型参数和梯度信息,所以实现反向传播的延迟通常要控制在毫秒级以下,国内的龙头企业都在做支持 10 万 GPU 卡以上规模的大模型,但采用的都是相对集中的集群系统,并没有采用异地分布式计算。" 他们的集群一般装在一个园区,可能有几个楼,分成几个计算岛,岛里面进行张量并行和流水线并行,岛之间做数据并行。但数据并行有个大问题,它要求一个 GPU 就要把整个模型参数存起来,GPT4 有 1.8 万亿参数,可能需要 10 个 TB 以上的内存,这个成本非常高。" 他说道。同时,他还表示," 在西部建很多小的超算中心、智算中心,联合起来就可以解决我们国家的人工智能训练问题,这样的想法可能并不太靠谱。"较为可行的解法还是 " 算力网 "。在李国杰的设想中," 算力网要发挥智能时代的基础设施的作用,也需要像有浏览器、微信一样的全民的普及应用。"当前算力提供商、政府及学界纷纷在呼吁算力网的建设,在这方面也做出了不同的努力:运营商布局云网融合,地方政府建算力枢纽中心,计算机界则聚焦于分布式计算的基础研究,例如,中科院计算所在做信息高铁项目、刘韵洁院士在做确定性计算网络、蒋昌俊院士在做机动性的方舱计算。不过李国杰也发现,目前,真正需要这种远程算力的关键用户到底在哪,暂时还不是很清楚。未来,在用户需求洞察的基础之上,前述各方布局可以形成一定合力。" 最迫切的一点在于为需要几百卡、几千卡做训练的中小模型单位找到合适的算力,如果把这件事真正做好了,就能打磨出算力网的 1.0 版本。几年后,推理会比训练需要更多算力,等到那时再升级 2.0 版本的算力网。" 李国杰预判。当前,算力网的抽象还涉及以下四个问题:一是怎么统一命名资源空间,也就是实现算力资源的池化;二是怎么提供一个万维网网页一样的运行式抽象;三是怎么提供一个统一的编程方法;四是怎么系统性评价算力网的性能。雷峰网雷峰网

koa12jJid0DL9adK+CJ1DK2K393LKASDad

编辑:罗元发

TOP1热点:华为上汽敲定第五界

  特约评论员 陈冰:普京就任后,做出的最重大决策,就是解除了绍伊古的国防部长职务,提名经济学家别洛乌索夫,担任这一重要职务。克里姆林宫说,由经济学家担任国防部长,是要更好地运用国防预算,并且通过创新来打赢乌克兰战争,同时让俄罗斯为经济战做好准备。普京临阵换将,显然是经过深思熟虑的。绍伊古领导的国防部,不仅出了腐败案件,而且战争思维还停留在过去,注重坦克、大炮、导弹的作用,对无人机等新型武器的开发没有予以足够重视。。

  但改革开放后,长江中下游诸多港口城市快速崛起,武汉在全国内河航运的地位大幅下降,水运甚至一度成为其综合交通运输体系中的短板。

TOP2热点:如何看待好利来表扬员工连续工作 29h

  盖志毅则表示,现在的内蒙古承担着粮食安全和绿色生态发展的双重重担,这也意味着不能再用过去的情况来划分林地等土地的性质了。“在当下,其实经济林与生态林的概念是可以很好融合的,比如像文冠果树就是一个很好的治沙作物,通辽就有全国最大的文冠果林之一,你很难定义它是生态林还是经济林。”盖志毅说,“林下种植也是实现林业效益一个很重要的做法,南方很多省份也在做,不能把林业、种植业、畜牧业三者对立起来,它可以是一个生态系统工程。但要怎么去把握这个度,是值得好好去研究的。”

  要种树,劳动力从哪里来?北京林业大学教授朱清科多年来深度参与“三北防护林”工程,主要研究水土保持和林业生态工程。他告诉本刊,在“三北防护林”前十年起步阶段,主要是靠发动农民群众,“最早是生产队,集体劳动记工分,从80年代包产到户以后就是每一户定种植的指标”。一些地方会把林地按照包产到户的方式分配给农民,允诺他们一定的使用权。国家林业和草原局在“三北”工程30周年之际刊文指出,工程一期上马不久,各地就结合农村家庭联产承包责任制,大力推行了承包造林、“谁造谁有,允许继承和转让”等政策,促进了造林生产责权利的结合,调动农民积极性。

TOP3热点:为什么甲状腺激素一定要用碘来合成md0070沈娜娜苏清歌团圆火锅

  吴七林在2010年延包了林地。这也是多数村民的选择:更新残次林能享有一定补贴,果树结果后还能拿到市场上售卖。同时在树苗的成长期,林间地也能利用起来种植农作物。但残次林更新的指标不是每年都有,柴达木嘎查2万亩的林地在2015年后才开始慢慢更新,每年只有1000~2000亩。2022年,更新指标终于轮到了吴七林家的30多亩地。这是吴家人在这片土地上的第二次造林。但与40年前不同的是,如今的自然环境让林木生长变得更困难。

  双方高度评价中俄在二十国集团中的建设性合作,重申愿继续加强该机制下协作,推动构建普惠包容的经济全球化,采取平衡且具有共识的行动应对突出的经济金融挑战,推动全球治理体系朝着更加公正的方向发展,提升“全球南方”国家在全球经济治理体系中的代表性。双方欢迎非洲联盟成为二十国集团正式成员,并愿为新兴市场和发展中国家利益共同作出建设性努力。

TOP4热点:《2025 年稳外资行动方案》发布天美麻花果冻

  双方强调,美国和北约作为侵略占领阿富汗20年的责任方,不应再次企图将军事设施部署到阿富汗及其周边地区,而应为阿富汗当前经济民生困局负主要责任,承担阿富汗重建的主要支出,并采取一切必要措施解除对阿富汗国家资产的冻结。

  双方愿在双边层面和多边机制下就阿富汗事务加强协作,推动阿富汗成为独立、中立、统一、和平的国家,免受恐怖主义及毒品的危害,同所有邻国和睦相处。双方高度重视并支持阿富汗邻国外长会、阿富汗问题“莫斯科模式”磋商、中国-俄罗斯-巴基斯坦-伊朗四国机制、上海合作组织等地区平台在政治解决阿富汗问题上所发挥的积极和建设性作用。

TOP5热点:苹果发布iPhone 16e姬小满无限奖励别人的英雄

  两国元首听取了两国政府间各合作委员会双方主席汇报投资、能源、经贸、东北-远东、人文、国际等领域合作情况,对取得的进展表示满意,对未来合作建议表示肯定。

  双方将同上海合作组织其他成员国协作,完善组织工作,挖掘政治、安全、经济和人文领域合作潜力,使欧亚地区成为和平、稳定、互信、发展繁荣的共同家园。

TOP6热点:俄美称就谈判目标达成共识星空无限传媒免费观看电视剧

  ——在信息通信技术领域开展互利合作,包括人工智能、通信、软件、物联网、开源、网络和数据安全、电子游戏、无线电频率协调、职业教育和专业科学研究。

  构建以国内大循环为主体、国内国际双循环相互促进的新发展格局,是基于我国比较优势变化,审时度势作出的重大决策。换句话说,融入双循环没有“局外人”。

TOP7热点:知乎推文授权仙踪林国精产品视频

  激发有潜能的消费,扩大有效益的投资,各地都迫切地希望形成消费和投资相互促进的良性循环。而文旅的“撬动”作用越发受到重视,带动批、零、住、餐,更带动文化演艺市场乃至城市品牌的塑造。

  TikTok封禁法案推出后,美国前总统特朗普曾多次警告,“封禁TikTok将使Facebook更加强大”、“拜登推进封禁法案的目的,是为了帮助Facebook的朋友”。值得玩味的是,2020年特朗普也曾力主美国封禁TikTok。

TOP8热点:马斯克将发布新一代大模型 Grok3姬小满无限奖励别人的英雄

  5月16日下午,国家主席习近平和俄罗斯总统普京在北京国家大剧院共同出席“中俄文化年”开幕式暨庆祝中俄建交75周年专场音乐会并致辞。

  原来种植的老杨树陆续出现枯萎现象,沙地又裸露出来,活下来的杨树低矮无力,被当地人称为老而不死的“小老头树”,防护林整体的防风固沙效应有衰减风险。为了扭转这些趋势,通辽市从2010年开始逐步推行原有林地上的残次林更新工程,鼓励农民们种植诸如文冠果、海棠果等经济林,去取代枯死衰竭的杨树,试图达到经济效益与生态效益的统一。

TOP9热点:推动解决拖欠民营企业账款问题日本最大的但的人文艺术

  双方愿同金砖国家其他成员落实历次金砖国家领导人会晤共识,推动新成员融入现有金砖合作机制,探讨金砖伙伴国合作模式。双方继续秉持金砖精神,提升金砖国家机制在国际事务、国际议程设置上的话语权,积极开展“金砖+”合作和金砖外围对话。

  双方再次对美国为维持自身绝对军事优势而破坏战略稳定的企图表示严重关切,主要包括美国建设全球反导体系并在世界各地和太空部署反导系统,强化高精度非核武器解除对方组织军事行动的能力和“斩首”打击能力,强化北约在欧洲“核共享”安排和对个别盟友提供“延伸威慑”,在《南太平洋无核区条约》缔约国澳大利亚建造可能用于保障美国、英国核力量实施行动的基础设施,开展美英澳核潜艇合作,实施在亚太和欧洲地区部署并向其盟友提供陆基中短程导弹的计划。

TOP10热点:哪吒2票房神话思考2022Ggy钙站不能用了

  激发有潜能的消费,扩大有效益的投资,各地都迫切地希望形成消费和投资相互促进的良性循环。而文旅的“撬动”作用越发受到重视,带动批、零、住、餐,更带动文化演艺市场乃至城市品牌的塑造。

  “本来端午节前后,就要打算收割小麦了,结果这场天灾导致麦田倒伏严重,今年收成又无望了。”刘欣表示,由于近日天气干旱,村子里的农户都集中在这两天进行灌溉,灌溉后的麦田土质疏松,外加这场大风造成了麦田倒伏。

发布于:巴东县