索14may18_XXXXXL56endianDe索14may18_XXXXXL56endianepSeek崛起,算力需求重构进行时_ZAKER新闻
De索14may18_XXXXXL56endianepSeek崛起,算力需求重构进行时_ZAKER新闻
李泽祥和团队成员实地走访了受灾严重的点位,“水位最高的时候,丁家滩村的牌坊淹没了一大半,只剩下丁家滩村几个字,这一处公交场站的淹没线已经超过了房顶,有的民房的淤泥达到了一人多高,还有部分房屋出现开裂、塌陷,受地质灾害影响大,在勘测中我们会根据房屋情况进行分类标记。”李泽祥说,根据实际摸排情况来看,如果村民房屋的室内水位达到50厘米及以上,这将对未来的居住产生影响,不建议居住;如果房屋的外立面完好,并且水位在50厘米以下,还有修缮的可能。
DeepSeek 爆火之后,一个普遍的误读是——大模型算力存在泡沫,有过剩的风险。在 DeepSeek-V3 和 R1 模型之前,大模型行业信奉 " 算力即权力,规模即护城河 " 的逻辑,当 DeepSeek 用不到同行十分之一的价格训练出效果更优的大模型,自然引起了对大模型算力逻辑的怀疑。于是一方面,英伟达等传统算力巨头的股价,一度因市场对 " 算力需求下降 " 的担忧而暴跌;另一方面,国产算力企业如海光信息、华为昇腾等因适配 DeepSeek 模型,或者股价飙升或者备受关注。这种割裂表明,业界对大模型算力的认知已从 " 规模至上 " 转向 " 效率优先 ",但算力需求的本质并未被消解,而是以更复杂的形式重构。算力需求下降?是,也不是DeepSeek 此番热潮的最大贡献,不在于单纯的算法优化,而是大幅降低了大模型的门槛,相当于一次全方位的大模型能力下探和普及。以往相同能力的大模型要么效果不佳,要么采取了闭源收费的策略,例如 GPT-4o,OpenAI 没有公布 GPT-4o 的技术细节,而是直接开展商业化,如今在 DeepSeek 的冲击下又不得不改变策略。同时,DeepSeek 足够低的成本也让更多用户有了尝鲜大模型的动力。中信建投表示,DeepSeek R1 通过较少算力实现高性能模型表现,主要原因是 DeepSeek R1 实现算法、框架和硬件的优化协同。DeepSeek R1 在诸多维度上进行了大量优化,算法层面引入专家混合模型、多头隐式注意力、多 token 预测,框架层面实现 FP8 混合精度训练,硬件层面采用优化的流水线并行策略,同时高效配置专家分发与跨节点通信,实现最优效率配置。当前阶段大模型行业正处于从传统的生成式模型向深度推理模型过渡阶段,算力的整体需求也从预训练阶段逐步过渡向后训练和推理侧,通过大量协同优化,DeepSeek R1 在特定发展阶段通过较少算力实现高性能模型表现,算力行业的长期增长逻辑并未受到挑战。行业一开始担心算力需求会下降,某种程度上是正确的,因为单一模型的训练和推理算力需求在下降,但是由此所带来的技术普及,是更大的算力需求。由此带来的算力需求呈现分化状态,其一,基础大模型的竞争并没有停歇,钛媒体 App 了解到,虽然一小部分玩家退出了预训练,但是字节跳动、阿里巴巴等基础大模型头部玩家还在加码预训练,只有更先进的基础模型,才有更高性价比的推理模型,高端算力仍将保持增长。其二,AI 应用普及带来的推理算力需求,DeepSeek 的全球日活用户从 34.7 万飙升至 1.19 亿仅用一个月,尽管单个模型推理成本降低,但用户规模和场景复杂度的大幅扩张,使得整体算力消耗不降反升。大模型算力的 " 杰文斯悖论 "1865 年,经济学家威廉 · 斯坦利 · 杰文斯提出了一个悖论:当技术进步提高了效率,资源消耗不仅没有减少,反而激增。例如,瓦特改良的蒸汽机让煤炭燃烧更加高效,但结果却是煤炭需求飙升;汽车发动机的效率提高了,汽油的总消耗量反而增加了;放到如今,就是 AI 算力支撑大模型的效率更高了,但算力的需求也进入到了新一轮的上升周期。有外媒将 DeepSeek 描述为斯普特尼克时刻,即苏联先于美国发射第一颗人造卫星,但其实这更像是谷歌提出云计算概念的那一刻,谷歌展示了分布式算法是如何把计算机网络连接在一起,并实现了价格和性能的最优解。彼时其他所有的科技公司在做些什么?大概是不断购买 " 高端算力 ",在当时就是 SUN 等公司提供的服务器,如今 SUN 已经消失在历史,历史总是惊人的相似,却不是简单的重复,产业的新故事继续上演。AI 产业需要类似这样的时刻,而且是越多越好,DeepSeek 的开源战略推动其模型快速渗透至教育、医疗、金融等垂直领域,AI 应用正在遍地开花。例如,其视觉语言融合模型 DeepSeek-VL2 在工业质检中的部署,需要实时处理高分辨率图像数据;代码生成模型 DeepSeek-Coder 则需支撑全球开发者的高频调用。这些场景对低延迟、高并发的需求,迫使算力基础设施持续升级。再以某电商平台为例,其客服系统引入 DeepSeek 后,日均处理咨询量从百万级跃升至千万级,对应的 GPU 集群规模需扩容 3 倍以上。国产算力还没到庆祝的时候无论愿意与否,DeepSeek 都成为了中国 AI 产业的一张名片,行业自然会联想到国产 AI 算力的进展,毕竟 DeepSeek 对单一算力需求降低,低算力的国产芯片可以在推理端有所发挥。从行业视角来看,DeepSeek 对国产算力确实是极大的利好,国产 AI 算力厂商纷纷宣布适配,包括昇腾、海光、壁仞科技、海光信息、摩尔线程、沐曦、燧原科技、天数智芯等厂商。但在国产芯片的融合方面,其实 DeepSeek 和其他国内大模型,甚至海外开源大模型并没有太多本质差别,DeepSeek 的训练也是基于英伟达芯片,其推理很大程度上依然运行在英伟达 GPU 上。一位国内 AI 芯片人士对钛媒体 App 表示,从算法的角度来说,国产 AI 芯片厂商核心是要走出一条不同的路,关键是底层的架构要符合市场,上层硬件使能的软件要整体适用。设计出来以后,才能把硬件发挥好性能,这是第一步。第二步,软件要做到足够的标准化以及足够的开放,让大家把性能挖掘出来,现在国产大部分厂商也面临着一些现状,大量的硬件厂商使用现成的架构,但是没有底层优化的能力。也有行业人士提到,国产 AI 的胜负手不在于单一技术优势,而在于生态开放性、需求创造性、产业链协同性的复合竞争力。未来算力竞争将呈现三大趋势,效率竞赛转向场景战争,谁能更低成本激活边缘场景,谁将主导市场;硬件霸权让位于架构主权,模型定义硬件的能力比芯片制程更重要;国产替代升级为全球规则,中国通过 DeepSeek 验证的软硬协同路径,或成为全球 AI 算力新范式。总体而言,DeepSeek 给国产 AI 算力打了一针强心剂,以往硬件⽣态系统封闭且互不兼容,不同芯⽚有着不同的架构和相应⼯具链,能不能在 DeepSeek 甚至之后的先进模型影响之下,趋于统一和标准化。DeepSeek 让大家更清晰认识到,或许在智能时代,最关键的资源不是芯片,而是人的创造力。(本文首发于钛媒体 APP,作者 | 张帅,编辑 | 盖虹达)koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:刘乃超
TOP1热点:2024这一年 获得 失去 释怀 成长 完结. 感恩每一位朋友的支持鼓励和帮助~爱你们!
李云泽长期在金融领域任职。23岁从天津大学基本建设管理工程专业、马克思主义基础专业本科毕业后,他进入中国建设银行天津和平支行的一家储蓄所工作,两年后,担任天津和平支行南门外分理处副主任。此后他先后在和平支行的资产保全部、天津分行的计划财务处工作,毕业后第十年,33岁的李云泽成为建行天津市分行行长助理。。
TOP2热点:西藏今早地震系周边5年最大地震
新京报讯 据应急管理部消息,8月11日8时至18时,陕西省西安市长安区局地出现大暴雨。18时许,长安区滦镇街道喂子坪村鸡窝子组突发山洪泥石流灾害。
应急管理部已派出工作组紧急赶赴现场指导救援处置,并调派当地消防救援队伍207人开展救援行动。截至12日7时,灾害已造成2人死亡、16人失联。目前,救援工作正在紧张进行。
TOP3热点:一口气看《赌神》传奇名场面,赌片宇宙开山之作,高进的成神之路办公室跪下拉开拉链吃应用的特点
报道称,台军16日在屏东九鹏基地实施精准弹药射击测考。清晨4时许,“雄风-2E”巡航导弹从该基地起飞,“在地面可目视其火箭助推器脱落”。据了解,该导弹随后顺利启动涡扇发动机展开巡航,“顺利飞行了一个多小时,达成预期验测目标”。
TOP4热点:白月梵星是callback的神把英语课代表按着抄视频
某三甲医院主治医生告诉大象新闻记者,医药代表作为医药公司和医生之间的纽带,通过有效的推介新药品、器械,在产业链上发挥着应有的价值,“但在这个过程中,因为医代和医生并非是产品的最终使用者,所以很容易从销售角度形成利益共同体,而非从产品自身优势、性价比这一初衷进行考量——这的确需要通过监督检查,进行有效的遏制。”
TOP5热点:来背圆周率美女露出🍑让客人玩
总之,IPO不是影响市场走势的决定性因素,也不应成为投资者投资决策的首要依据。市场各方应坚定市场化改革方向不动摇,坚持价值投资不放弃,共同呵护资本市场稳中有进、行稳致远。 (作者:李华林 来源:经济日报)
有地方蓝天救援队负责人告诉记者,一些地方的蓝天救援队申请成立之前,总部约法在先,一是不能帮人做广告,二是不能接受社会现金捐赠。
TOP6热点:西藏地震周边5公里有7个村庄小芳好大⋯太涨⋯快点视频
在此次涿州洪灾救援中,有多支救援队遭遇险情。丰宁蓝天救援队在一次行动中,救援船只被水中的漂浮物划破后出现漏气,又遇到激流,船只出现甩尾和测滑,差点被卷入激流。
TOP7热点:一口气看完春秋三百年,超长时长警告!白袜大学生宿舍打✈️Tv漫画
“这个过程本身没什么问题,但在这些合规的、频繁的工作交集中,医生与药企医代表之间的连接越来越紧密,关系越来越‘铁’。”该负责人表示,两者关系的拉进,为进一步的利益绑定提供了基础。
在此次涿州洪灾救援中,有多支救援队遭遇险情。丰宁蓝天救援队在一次行动中,救援船只被水中的漂浮物划破后出现漏气,又遇到激流,船只出现甩尾和测滑,差点被卷入激流。
TOP8热点:几分钟看完《Ave♿️Mujica》第一集Chinagary体育飞机网站
李云泽长期在金融领域任职。23岁从天津大学基本建设管理工程专业、马克思主义基础专业本科毕业后,他进入中国建设银行天津和平支行的一家储蓄所工作,两年后,担任天津和平支行南门外分理处副主任。此后他先后在和平支行的资产保全部、天津分行的计划财务处工作,毕业后第十年,33岁的李云泽成为建行天津市分行行长助理。
TOP9热点:为什么很多片尾曲节奏欢快,却给人失落的感觉?47147大但人文艺术豆瓣
2023年6月份,应急管理部部长王祥喜在新闻发布会上透露,目前,通过改革转型,我国已经建成水域、山岳、地震专业救援力量5000多支,救援装备也大大提升。另外将社会力量纳入救援体系,现在大约2300支近5万人的队伍。
实际上,这是很多民间救援队面临的共同问题,“平民英雄”的光环之下,是走不出去的现实困境,即使像蓝天救援队这样的头部品牌也难逃“资金劫”。
TOP10热点:西藏地震周边5公里有7个村庄上海贵妇尝试黑人洋吊
报道称,台军16日在屏东九鹏基地实施精准弹药射击测考。清晨4时许,“雄风-2E”巡航导弹从该基地起飞,“在地面可目视其火箭助推器脱落”。据了解,该导弹随后顺利启动涡扇发动机展开巡航,“顺利飞行了一个多小时,达成预期验测目标”。