宝贝放松智算“万宝贝放松卡”潮起,国产AI芯片迎高光时刻_ZAKER新闻
智算“万宝贝放松卡”潮起,国产AI芯片迎高光时刻_ZAKER新闻
国家大基金三期经营范围为私募股权投资基金管理、创业投资基金管理服务,以私募基金从事股权投资、投资管理、资产管理等活动,企业管理咨询。股东信息显示,该公司由财政部、国开金融有限责任公司、上海国盛(集团)有限公司、中国工商银行股份有限公司、中国建设银行股份有限公司、中国农业银行股份有限公司、中国银行股份有限公司等19位股东共同持股。
文 | 半导体产业纵横GPU 万卡集群,小米下场了!摩尔线程智算集群扩展至万卡!中国移动将商用三个自主可控万卡集群 ...... 一系列标题的袭来,让笔者突然意识到,仿佛在不经意间,智能算力建设已然迈入万卡时代。那么到底什么是万卡集群?万卡集群到底有哪些作用?有必要部署万卡集群吗?01 什么是万卡集群?万卡集群,是指由超过一万张加速卡(如 GPU、TPU 或其他专用 AI 加速芯片)组成的高性能计算系统,用以加速人工智能模型的训练和推理过程。至于为什么需要一万张加速卡?众所周知,大模型竞赛的本质是算力竞赛。比如这里有一个超大土堆,放一个工人和放一万个工人,在效率上肯定会有质的飞跃。以 OpenAI 训练 GPT 模型为例,GPT-4 需要使用 2.5 万张英伟达 A100 GPU,并行训练 100 天左右的时间,在此期间要处理 13 万亿个 token,并且涉及大约 1.76 万亿个参数。在不久的将来,开发大模型所需的算力将实现指数级的增长,对于即将亮相的 GPT-5,预计该模型的训练需要部署 20 万 ~30 万个 H100 GPU,耗时 130~200 天。如今 OpenAI 发布 ChatGPT 已有两年的时间,从建设进度上看,海外头部厂商在 2022 年、2023 年已经完成万卡集群搭建。比如 2023 年 5 月,谷歌推出的 AI 超级计算机 A3,搭载了约 26000 块英伟达 H100 GPU;2022 年,META 宣布了一个由 1.6 万块英伟达 A100 GPU 组成的集群。到了 2024 年初,META 进一步扩大规模,建成了两个各含 24576 块 GPU 的集群,并设定了宏伟目标:到 2024 年底,构建一个包含 35 万块英伟达 H100 GPU 的庞大基础设施。亚马逊 Amazon EC2 Ultra 集群采用了 2 万个 H100 TensorCore GPU。再看中国的智能算力建设情况。02 国产万卡集群,谁在布局?日前,中国工程院院士郑纬民指出," 构建国产 AI 卡的万卡大模型训练平台很难,但也很重要以及必要。"当下,国内已有多家厂商及机构着手向万卡集群领域拓展业务。根据《智算产业发展研究报告 ( 2024 ) 》显示,在中国,超万卡集群的智算中心已达十余个。今年以来, 中国移动 、联通、电信三大运营商均在加速推进超万卡集群智算中心的建设。今年 8 月,中国电信在智算网络建设方面取得了显著进展,其上海与北京两大万卡集群已成功投产运营。中国移动位于呼和浩特、哈尔滨、贵阳的万卡级别的智算中心已经先后投产运行。据悉,三大集群总规模近 6 万张 GPU 卡,充分满足大模型集中训练需求。中国联通正在打造上海、呼和万卡智算集群,全网智算算力超 15EFLOPS,发布 AICC、AICP、星罗调度平台等五大智算产品,提供涵盖国家 " 东数西算 " 枢纽、31 省重点城市、超 600 边缘节点的 AIDC 基座。小米也正计划建设一座 GPU 万卡集群。据悉,小米在其大模型团队成立时已经拥有 6500 张 GPU 资源。字节在 2023 年就已建立起超过 1 万张卡的 Ampere 架构 GPU (A100/A800) 集群,此后还在建设大规模 Hopper 架构(H100/H800)集群。如今," 万卡集群 " 被业界视作是这一轮大模型竞赛的 " 入场券 ",甚至还有不少厂商已经开始布局 " 十万卡集群 "。百度的百舸 4.0 通过一系列产品技术创新,已经能够实现十万卡集群的高效管理。阿里巴巴的阿里云可实现芯片、服务器、数据中心之间的高效协同,支持 10 万卡量级的集群可扩展规模,已服务全国一半的人工智能大模型企业。腾讯已宣布自研星脉高性能计算网络全面升级,星脉网络 2.0 搭载全自研的网络设备与 AI 算力网卡,能够支持超 10 万卡大规模组网,网络通信效率比上一代提升 60%,让大模型训练效率提升 20%。03 国产 AI 芯片公司,得到利好显然,在运营商以及科技巨头纷纷入场布局之际,国产 AI 芯片公司也迎来利好。华为昇腾据悉,以政府为主导的城市智能计算中心多采用国产 A1 芯片中的佼佼者如华为昇腾等,其中华为更是在统计的 20 多个城市为主体的智能计算中心中占据 79% 的市场份额,处于国产 AI 芯片的领先位置。在可预见的 2025 年,昇腾芯片及服务器的市场依旧会处于紧张的供给局面。寒武纪2023 年寒武纪思元(MLU)系列云端智能加速卡在中国移动正式上线。截至 2023 年 12 月,中国移动已有 12 个省公司、超过 70 个 AI 业务完成向寒武纪思元系列云端智能加速卡的迁移。2024 年 8 月,中国移动云能力中心参建的全球运营商最大单集群智算中心——中国移动智算中心(哈尔滨)正式投产使用。该智算中心部署超 1.8 万张 AI 加速卡,AI 芯片国产化率达 100%,可提供 6.9EFLOPS(每秒 690 亿亿次浮点运算)智能算力。据悉,该智算中心就是由寒武纪参与建设。南京智能计算中心由南京市麒麟科技创新园与浪潮、寒武纪共同打造,采用浪潮 AI 服务器算力机组,搭载领先的寒武纪思元 270 和思元 290 智能芯片及加速卡,已运营系统的 AI 计算能力达每秒 80 亿亿次 ( 800P OpS ) 。大模型爆火的当下,AI 的训练和推理芯片及训推一体化等芯片成为市场 " 香饽饽 ",寒武纪在此领域的深耕研发,加速思元系列芯片的迭代。摩尔线程2023 年 12 月摩尔线程 KUAE 智算中心揭幕,这是国内首个以国产全功能 GPU 为底座的大规模算力集群,以全功能 GPU 为底座,提供软硬一体化的全栈解决方案。2024 年 7 月,摩尔线程联合中国移动通信集团青海有限公司、中国联通青海公司、北京德道信科集团、中国能源建设股份有限公司总承包公司、桂林华崛大数据科技有限公司等,分别就三个万卡集群项目进行了战略签约,多方将聚力共同构建好用的国产 GPU 集群。燧原科技2021 年燧原科技与之江实验室在之江实验室南湖新园区签约成立 " 燧原 - 之江人工智能芯片联合研究中心 "。成渝智算中心由四川并济科技投建,燧原科技提供搭建算力底座。与此同时,燧原科技还助力太湖亿芯(无锡)智算中心、甘肃庆阳算力枢纽的建设。天数智芯中国移动智算中心(呼和浩特)是全球运营商领域内规模最大的单体液冷智算中心,智算规模高达 6.7EFLOPS(FP16),拥有国家级 N 节点万卡规模 AI 训练场。天数智芯在该项目中充分发挥天垓 150 产品的卓越性能与广泛适用性,与新华三信息技术强强联合,共同打造高性能 AI 训练服务器。壁仞科技壁仞科技也参与中国移动呼和浩特智算中心项目。此外,壁仞科技的壁砺系列通用 GPU 算力产品还在中国电信落地千卡集群并开展商业化应用,另外在中国电信集团新一轮国产化 GPU 集采项目中,壁仞科技的主流 GPU 产品已经纳入中国电信的集采名录,成为中国电信的主要 GPU 供应商。沐曦科技2024 年 11 月,由上海联通携手加佳科技、沐曦共同打造的曦源一号 SADA 万卡集群算力项目第一期千卡国产算力集群在上海联通临港机房正式落地。该项目以沐曦 GPU 芯片技术产品为核心,着力构建集算力、算法、数据、产业应用为一体的人工智能产业新生态。据悉,沐曦和加佳科技已在上海、湖南、江苏等多地建成智算中心,并计划于 2025 年 6 月完成 10000 卡国产高质量算力建设。04 何止 " 万卡 ",甚至要 " 百万卡 "从早期智算中心艰难起步,一步步发展到如今 " 万卡 " 规模的算力集群纷纷落地,这无疑是巨大的飞跃。当下,行业头部厂商更是将视野进一步拓宽,已然聚焦于更为宏大的 " 百万卡 " 目标。近日,在 AI 市场快速增长的背景下,博通市值突破 1 万亿美元,创下历史新高。博通首席执行官陈福阳表示,他有信心在 2020 年代后期继续加大对人工智能的投资。他指出,三年内,博通的客户计划构建配备数百万个 AI 芯片的大规模计算集群,从而推动市场大幅增长。博通正与三大客户合作开发 AI 芯片,计划到 2027 年在网络集群中部署 100 万个芯片。据 CNBC 报道,他估计,到 2027 年,其 XPU 和 AI 网络组件的总市场规模将达到 600 亿至 900 亿美元。虽然博通尚未正式公布其芯片客户,但分析师表示,该公司正在与谷歌、Meta 和字节跳动合作,以加速 AI 系统的训练和部署。据《金融时报》报道,该公司已为此开发了定制处理器。05 " 万卡集群 " 真的有必要吗?先说结论," 万卡集群 " 的建设一定是有必要的。当前,我国智能算力供不应求的问题较为突出,大模型对算力的需求增速远超单颗 AI 芯片性能的提升步伐。相关报告显示,2023 年,中国智能算力需求达 123.6EFLOPS,而供给仅为 57.9EFLOPS,供需缺口一目了然。利用集群互联弥补单卡性能短板,或是现阶段缓解 AI 算力荒最值得探索与实践的有效途径。不过,在推进 " 万卡集群 " 建设进程中,有两大关键难题亟待解决:其一,怎样高质量完成建设任务,保证集群在稳定性、高效性、兼容性等多方面达到标准要求;其二,建成后如何充分挖掘其应用价值,使其在人工智能训练、大数据分析等适配场景发挥最大作用,杜绝资源空置与浪费现象。首先,不妨将 " 万卡集群 " 类比为参与 " 多人多足 " 游戏的团队,大家都清楚,让一群人如同一个人般整齐划一地前行并非易事,要调度上万张计算卡协同高效作业、达成性能的线性扩展、确保任务无间断运行,这对集群的设计、调度以及容错能力都提出了极高挑战。其次,智算中心的建设只是一个开端,更重要的是后续的有效运用。据报道,由于智算中心的投资、建设、运营通常由不同主体负责,前期建设方常常对后续运营模式、服务标准缺乏足够考量,出现 " 只管建设、不顾运营 "、建设与运营脱节的情况,影响了客户体验,致使不少城市所建智算中心的机架利用率不尽人意。从商业模式来讲,智算中心大多以出租或售卖算力为主要盈利手段,然而因行业尚未统一算力定价标准,不同智算中心价格差异悬殊,市场接纳程度受限。近期,多位智算中心领域从业者走访国内各地智算中心后,他们中的一些人向《智能涌现》反馈,当前国内算力中心市场较为低迷。一位业内人士透露:" 就目前所掌握情况,多数机房出租率大致在 20% - 30% 区间浮动,部分企业级智算中心出租率甚至低至 10% 左右。"要清楚,智算中心不仅前期需要投入巨额资金购置 GPU 等 AI 芯片,后续运营阶段同样需要持续注资。《智能涌现》不久前发文指出,一台英伟达 H100 服务器(8 卡)租赁价格,已从年初的 12- 18 万元 / 月,下滑至目前的 7.5 万元 / 月,降幅约 50%。若按照当前机房 20% 的利用率来算,一个英伟达 H100 千卡集群智算中心每年营收仅 2300 万元(即 7.5 万元 / 月 ×12 个月 ×128 台服务器 ×20%),这意味着,即便算力中心勉强维持运营,所得收入基本只能覆盖一半的正常运营成本,前期投入的资本根本无从回本。综上所述," 万卡集群 " 已成为智能算力时代的重要里程碑,标志着我国在人工智能领域的算力建设迈上了新的台阶。从小米、中国移动等科技巨头正积极布局万卡集群,以期在这场大模型竞赛中占据有利地位。然而,万卡集群的建设并非易事,智算中心需要多长时间才能通过运营收入收回投资,行业也还需更多的探索。koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:余克勤
TOP1热点:吹嘘特朗普“50天50胜”,白宫击穿美国人底线
从今年1月1日起,沙特、埃及、阿联酋、伊朗、埃塞俄比亚成为金砖国家正式成员,金砖成员国数量从5个增加到10个。中国与阿拉伯国家的合作也进入新阶段。。
此外,萧旭岑指出,由于卸任领导人礼遇结束后的维安,台湾地区并无前例可循,加上日本前首相安倍晋三、斯洛伐克总理遇刺,更凸显卸任领导人的维安问题,对社会稳定有多重要。
TOP2热点:马上评|为什么说呼和浩特“催生”诚意满满
2012年,华春莹担任外交部新闻司副司长、新闻发言人。她是继李金华、范慧娟、章启月、姜瑜之后,外交部第五位女性新闻发言人。
TOP3热点:影子暗访·315丨快递取件被强收3元“跑腿费”校服下摆太紧不好C
2024年4月10日,何立峰在北京会见新加坡副总理兼经济政策统筹部长王瑞杰,双方就宏观经济形势、中新金融合作等深入交换了看法。
曾说“我做球员的时候最憎恨的就是踢假球”的李铁却堕落为足球腐败黑幕的核心,这种风气通过老球员带新球员,毫无疑问地在青年球员中蔓延。
TOP4热点:马上评|为什么说呼和浩特“催生”诚意满满在床上拔萝卜又疼又叫什么症状
萧旭岑说,希望赖清德不要坐视、纵容民进党政客煽动支持者情绪,甚至暗中鼓动侧翼攻击马英九,绝对要避免发生憾事,否则将是台湾不可承受之重。
4月30日,深沪交易所正式发布修订后的《股票发行上市审核规则》等业务规则,提高各板块上市财务条件,进一步明确板块定位要求。
TOP5热点:澎湃回声|南阳市监局回应“菌污爆表足浴包”:第一时间赴涉事企业核查缅北14may18_XXXXXL56endian
自进入5月份以来,中国海警位金门附近海域,已经开展了多次常态化执法巡查行动,而在对历次执法行动进行分析和对比后,一位长期关注中国海上执法行动的专业人士告诉过谭主,中国海警将会参照“金门”模式,将自己执法行动的范围,逐渐扩大到马祖、澎湖,乃至是整个台湾海峡。随即, “‘金门’模式”一词被岛内诸多媒体引用讨论。
此次在旧金山,龚正与布里德共同签署了两市新一轮合作备忘录,涵盖经济、文化旅游、体育、环境与可持续发展、城市治理等多个领域。
TOP6热点:惠州回应“30多名男子被女友‘刘佳’诱导买房”:共有15名女销售参与重生之洪荒天尊
“从主教练到球员,从干部任用到球员选拔,这些环节有法律法规、人事任用标准、人才选拔制度来规范,本该是足协干部、教练的‘紧箍咒’,但最后却成了他们设租敛财的‘护身符’。”施鹏鹏说。
李某是我国某领域专家,在该领域拥有多项高端科研成果,著述颇丰,享誉海内外。一次,李某因工作需要,持护照赴某国开展实地调研,却没想到原以为十分正常的公务出行竟落入了境外间谍情报机关的窃密“陷阱”。
TOP7热点:南京救助91岁摔倒老人的绿衣小姐姐找到了国内久经典AAAAA片
据中国足协官网显示,中国足协根据法律授权和政府委托管理全国足球事务,是全国性、非营利性、体育类社团法人和具有公益性质的社会组织。足协设有秘书处,现管理国家队管理部、竞赛部、裁判部等14个职能部门,还设有纪律委员会等专项委员会,在授权范围内依工作规范协助执委会处理本会专项事务。
2024年4月10日,何立峰在北京会见新加坡副总理兼经济政策统筹部长王瑞杰,双方就宏观经济形势、中新金融合作等深入交换了看法。
TOP8热点:影子调查|垃圾围困浯屿岛:清理转运正进行,多年顽疾待解一次又一次凶猛的撞着你的脸歌词
据《贵州日报》消息,5月20日,贵州省开展孙志刚严重违纪违法案以案促改工作领导小组召开会议,听取孙志刚案以案促改工作进展情况汇报。贵州省委书记、领导小组组长徐麟主持会议并讲话。省委副书记、省委政法委书记时光辉,省委常委李元平、时玉宝、郭锡文参加。
曾说“我做球员的时候最憎恨的就是踢假球”的李铁却堕落为足球腐败黑幕的核心,这种风气通过老球员带新球员,毫无疑问地在青年球员中蔓延。
TOP9热点:夜读丨谁在读陀思妥耶夫斯基51吃瓜今日吃瓜入口
据媒体报道,王小平最“巅峰”的时期是2017年,这一年他开了152张罚单,罚款更是高达350万元,这些处罚决定很大程度上影响了相关球队的联赛竞争力。
也正是因为如此,此次中国海警在发布相关信息时,没有使用此前曾经屡次使用的“执法巡查”这一说法,而是换上了“综合执法演练”这个新的表述。
TOP10热点:江苏银行:稳健经营领航,不良率创历史新低MACBOOKPRO免费网站
“此次会议是首届中国-阿拉伯国家峰会(2022年12月在沙特首都利雅得举办)后论坛举办的首次部长会,具有承前启后的重要意义。”