文学新视-"蓝颜tv"-DeepSeek真成救世主了蓝颜tv_ZAKER新闻

蓝颜tvDeepSeek真成救世主了蓝颜tv_ZAKER新闻

蓝颜tvDeepSeek真成救世主了蓝颜tv_ZAKER新闻

DeepSeek真成救世主了蓝颜tv_ZAKER新闻

近年来,闵行区将全国文明城区创建作为推进全区“五位一体”全面发展和建设人民城市的龙头工程,积极践行“德厚闵行·文进万家”理念,统筹推进文明培育、文明实践、文明创建,一步一个脚印把文明城区发展的“愿景图”,化作市民身边一幅幅靓丽的“实景画”。2020年,闵行区被中央文明委授予“全国文明城区”称号。

出品|虎嗅 ESG 组作者|陈玉立头图|电影《黑客帝国》本文是 #ESG 进步观察 # 系列第 119 篇文章本次观察关键词:DeepSeek去年年中,AI 大模型发展风头正劲之时,谷歌一份环境报告引发媒体 " 担忧 " ——自 2019 年以来,其温室气体总排放量增长了 48%。不止谷歌,微软也在去年 5 月透露二氧化碳排放量增加了近 30%,科技巨头公司碳排放增加的核心原因都被归于一点——人工智能模型、硬件和数据中心的能耗正在大幅攀升。可以说,若 AI 军备竞赛时代到来,人类很可能陷入一场从未预见到的能源危机。但事情却在最近起了戏剧性变化。近期,微软取消了威斯康星州 Kenosha 和乔治亚州亚特兰大两个数据中心项目的决策,涉及数百兆瓦的电力容量调整;此外,根据 TD Cowen 最新研究报告显示,微软已终止与多个私营数据中心运营商的租赁协议,并暂停部分国际资本支出计划。这一系列举措不仅折射出人工智能基础设施建设领域正在发生的结构性转变,更是被市场解读为 AI 投资热潮降温的重要信号。TD Cowen 分析师指出,微软此次战略调整的核心在于应对 " 供应过剩 " 的行业新常态。伴随着近期 AI 概念股普遍回调,某种程度上凸显出资本对大模型估值的态度变化—— DeepSeek 这条 " 鲶鱼 " 引发的技术冲击,对大模型未来的技术演化提出了一条新的思考路径。更少的芯片数量、更低的训练成本,DeepSeek 在改变 AI 企业算力预期的同时,也将未来 AI 算力可能带来的能源消耗做了极大的削减。半开玩笑地讲,人类如果没有因 AI 算力的增长而陷入能源危机,DeepSeek 很有可能是 " 首功 "。DeepSeek 是如何降低能源消耗的?灵碳智能创始人李博杰认为,DeepSeek 在技术上主要通过 4 个方面降低了训练成本:一是流水线并行优化(DualPipe):通过设计前向传播和反向传播的交错执行(如 1F1B 及其扩展策略),实现了计算任务与数据通信的完全重叠,从而最大化 GPU 利用率,缩短了训练过程中因等待产生的 " 气泡 " 时间。二是冗余专家策略的负载均衡器(EPLB):在 MoE(混合专家系统)架构下,不同专家的工作负载可能严重不平衡。EPLB 通过复制繁忙专家,为部分专家分担负载,避免了部分 GPU 长时间闲置,从而更高效地利用硬件资源。三是 FP8 混合精度训练:相比传统使用 FP16/FP32 的混合精度训练,DeepSeek   v3 " 广泛地采用了 8 位浮点数进行训练 "。这使得内存与计算资源的消耗大幅降低,不仅减少训练时所需的硬件资源,也间接降低了能耗和相关的电力成本。四是多令牌预测(MTP):通过一次生成多个 token,改善了信息利用率,既能提高训练和推理效率,也有助于缩短整体训练时间,降低计算资源消耗。具体到 GPU 耗能层面,据李博杰测算,DeepSeek 预训练共耗费大约 2.66  百万 GPU 小时,强化学习(RL)阶段约耗费 0.5  百万 GPU 小时,合计约为 3.16  百万 GPU 小时。假设使用的是 H800 GPU,此类数据中心级 GPU 的功耗通常在 500W~700W 之间,取平均值 600W 计算,即每个 GPU 小时消耗 0.6   kWh 的电能。最终总能耗≈ GPU 小时数 × 平均每小时耗电,结果约为 1.9 GWh 电能消耗。作为对比,我们拿 GPT-4 Moe 为案例计算其在 GPU 方面的电能消耗。据黄仁勋在 GTC2024 上的演讲,GPT-4 Moe 使用了 8000 个 H100 GPU 进行了 90 天的训练,总 GPU 卡时为 17.28 百万 GPU 小时。而 H100 GPU 的设计功耗(TDP)为 500-750W,取平均值 600W 计算,可得最终总能耗约为 10.4GWh,与 DeepSeek 相比翻了 5 倍。虎嗅 ESG 组曾在《AI 革命,是能源的一场 " 灾难 "》一文中指出,普通人家一年的用电量大概在 1000kwh 左右,这意味着 DeepSeek 节约出的电能足够近一万个家庭使用一年。李博杰指出,人工智能大模型之所以如此耗能,原因是因为目前主流的 LLM 模型采用了基于 transformer 架构的深度神经网络算法,这种架构的算法通过自注意力机制处理数据,并考虑序列的不同部分或句子的整个上下文,从而生成对模型结果的预测。" 市面上先进的 LLM 通常包含了万亿级别的参数,参数越多,模型复杂度越高,训练时的计算量就越大。"而 DeepSeek 通过优化训练模型(引入多头潜在注意力机制)加上推出新的强化学习算法 GRPO 等举措,在显著降低计算成本的同时,还提高了模型的训练效率,最终实现其模型训练成本只有 OpenAI 的 1/10,使用成本只有 OpenAI 的 1/30。根据国际能源署的数据,2022 年美国 2700 个数据中心消耗了全国总电力的 4% 以上;预计到 2026 年,全球数据中心的电力消耗可能会翻一番。但目前从 DeepSeek 引发的 " 降本狂潮 " 来看,因数据中心带来的电力消耗或许不会如此巨大。间接能源减耗空间巨大与技术创新带来的训练能耗大大减少相比,因 DeepSeek 的技术创新间接带来的减碳空间同样巨大。从市场竞争的角度看,面对 DeepSeek 技术创新带来的 " 降本 " 压力,不少 AI 公司都在加速淘汰低效模型架构,最为典型的是 meta。meta 首席执行官扎克伯格将 2025 年称为 "AI 的决定性一年 ",并期望 meta AI 能成为服务超过十亿人的领先助手。但面对 DeepSeek 带来的新挑战,meta 已陷入恐慌模式。《The Information》在年初曾报道,meta 的 AI 团队领导层包括 AI 基础设施总监马修 · 奥尔德姆,最近都担心 DeepSeek 的出现意味着 meta 在 AI 竞赛中正在落后。他们尤其害怕 meta 在本季度发布的下一代旗舰 AI Llama 的表现将不如 DeepSeek。据《The Information》引用的两位 meta 员工称,meta 已成立了多个 " 作战室 " 或专业研究小组,以剖析 DeepSeek 并利用其见解改进 Llama。至于马斯克的 Grok 3,在堆了 20 万张 H100 显卡后,其评分测试确实比 OpenAI、DeepSeek 的得分更高。但如此大量的算力带来的是更大的能源消耗,据财经大 V 淘沙博士测算,Grok3 单次训练的碳排放量相当于 4.6 万辆汽车的年排放量,单位能耗效率上 DeepSeek   R1 比 Grok3 低 67%。就算马斯克再有钱,也不可能放着捷径不走而继续 " 铺张浪费 "。微软转向支持 DeepSeek、meta 开始研究 DeepSeek 算法都足以说明,DeepSeek 正在颠覆 AI 巨头们堆算力、堆芯片这一 " 大力出奇迹 " 的模式,走向精细化运营。除了市场竞争角度外,从供应链上下游角度分析,DeepSeek 也给能源行业 " 好好上了一课 "。在 DeepSeek 出圈之后,除夕夜前一天能源供应商 Constellation Energy 股价下跌 21%,电力企业 Vistra 下挫 28%。"DeepSeek 重置了中美在人工智能领域的竞争环境,更重要的是,它从根本上颠覆了能源领域。" 国际税务与投资中心能源、增长与安全项目助理主任何伟龙(Wesley Alexander Hill)在发表于《福布斯》杂志的署名文章中表示,全球许多国家制定能源政策所基于的基本假设,即人工智能必会带动需求不断增长,已经不复存在。最后,在对传统能源企业的赋能方面,DeepSeek 也能有令人惊异的表现。例如对于化工企业而言,通过实时分析生产数据(如反应参数、设备状态),可动态调整工艺条件。有垂类自媒体指出,在甲醇精馏装置中,通过模型优化工艺参数后能实现蒸汽消耗降低 15%,产品收率提升 8,提升设备综合效率(OEE)达 12%。而中国石化也在近期对外反馈,中石化 DeepSeek-R1 模型已经在进口 GPU 和国产 GPU 平台上完成验证测试,推理计算效率提升近一倍。未来,DeepSeek 可以应用在中石化的地震资料处理、油藏开发优化、化工产品研发等核心领域。总结而言,DeepSeek 已通过技术颠覆、成本重构以及开源生态,在训练环节和企业级应用中产生了明确的节能案例,未来节能减碳的空间仍然巨大。更广泛的社会效益分析到这里,DeepSeek 已经在 ESG 中的 "E(环境)" 上有着不俗表现,但在 "S(社会)" 和 "G(公司治理)" 上,DeepSeek 同样有着极佳的案例应用。在 "G(公司治理)" 层面,《中国经营报》在近期发表文章指出,随着微信、百度等科技巨头接入 DeepSeek,同时各地政务系统纷纷上线基于全栈国产化技术的 DeepSeek-R1 智能模型,导致算力需求急剧增长。随着 DeepSeek 在多领域大展拳脚,未来社会对算力的需求会持续增长。而在 "S(社会)" 层面,据澎湃新闻报道,广西玉林市兴业县已有乡镇将 DeepSeek 用于防返贫监测," 通过 DeepSeek 对全镇脱贫户数据进行动态分析,精准识别潜在返贫风险家庭,并自动生成帮扶建议,分析效率较传统方式提升 50%。"如此看下来,DeepSeek 在 ESG 各维度的潜在助推价值无疑还具备相当大的可开发空间,无疑是 " 大隐隐于市 " 的存在。而当下的人工智能或许仅仅是 DeepSeek 的一面,其效率至上所体现出的工具理性,以及将环境友好、社会公平、公司治理纳入技术演进的内在逻辑,将为人类推动社会的可持续发展带去更多惊喜。

koa12jJid0DL9adK+CJ1DK2K393LKASDad

编辑:王海

TOP1热点:广西一中学教师被举报性侵,致女生轻生,官方称「部分内容属实,警方介入调查」,如何才能避免类似事件发生?

今年,静安团区委助力辖区青年精准解决住房需求,和魔方公寓上海大宁国际社区签订《静安团区委创建青年人才驿站合作协议书》,并成立了由共和新路街道团工委、共和新路派出所、街道社区卫生服务中心、魔方公寓运营工作人员及公寓租户青年代表组成的家委会。聚焦“小青年”的“大问题”,发挥青年在居住空间自治、社区志愿服务等工作中的积极作用。。

新华社太原8月20日电据中国帆船帆板运动协会消息,在日前于荷兰海牙结束的2023世界帆船锦标赛中,中国帆船帆板队获得女子水翼帆板、女子水翼风筝板和男子水翼风筝板三个项目的巴黎奥运会参赛资格。

TOP2热点:哈里森拒绝给东契奇 3.5 亿顶薪,为什么他会选择拒绝?

此外,S3公路的建成将助力奉贤实现“30-45-60”的出行目标,30分钟实现与中心城连接,45分钟到达临港新片区主城区和国际级枢纽,60分钟衔接杭州、宁波等城市,而临港新片区到陆家嘴更是最快仅需40分钟,并缓解南北向道路的“向心交通”情况。

现实给他们上了一课。社区工作者的工作内容涉及党建、民政、计生、文教体卫、综合治理等方面,还要联系工会、妇联、共青团,这些工作不是坐办公室、点点鼠标就能完成,大量事务需要他们在奔走中沟通、协调、落实。大场镇乾溪一居社工刘文婷说,骑小电驴是工作后掌握的新技能,也是不得不掌握的技能。平时在小区里上门慰问困难群体、给失独家庭送菜,轻轻松松上万步,“但如果要去两个社区卫生服务中心,或是到镇政府、党群服务中心、社区办、社区为老服务中心等办事,都靠小电驴帮忙节省时间、提高效率。”

TOP3热点:有哪些十分令人惋惜的已灭绝动物?人分为精品废品

决赛中,两支学校代表队的学生辩手就“是否该禁止民间放生行为”展开了激烈的辩论。两队学生在赛前经过自博馆科学老师与上海铁路运输检察院检察官的共同辅导,广泛搜集资料、做足准备。在辩论现场,双方辩手引经据点、旁征博引,给现场评委与观众呈现了一场有关自然科学、法律法规、论辩技巧的精彩对决。

柯马凯的幼儿园是在院里上的。如今,这里至少住着三位他上幼儿园时的阿姨。小时候,阿姨们管柯马凯叫“迈克尔”。有一次,柯马凯到上海参加会议,被一位阿姨的女儿认出,她正在上海一所招收外籍人子女的国际学校里教书。

TOP4热点:如何评价 2025 年 2 月米哈游《崩坏星穹铁道》遐蝶立绘?2023年国防部原部长

另外,我们还可以通过观察小便的颜色来帮助我们判断水分的摄入是否足够,如果小便的颜色呈现深黄甚至琥珀色,这是身体缺水的信号。

现实给他们上了一课。社区工作者的工作内容涉及党建、民政、计生、文教体卫、综合治理等方面,还要联系工会、妇联、共青团,这些工作不是坐办公室、点点鼠标就能完成,大量事务需要他们在奔走中沟通、协调、落实。大场镇乾溪一居社工刘文婷说,骑小电驴是工作后掌握的新技能,也是不得不掌握的技能。平时在小区里上门慰问困难群体、给失独家庭送菜,轻轻松松上万步,“但如果要去两个社区卫生服务中心,或是到镇政府、党群服务中心、社区办、社区为老服务中心等办事,都靠小电驴帮忙节省时间、提高效率。”

TOP5热点:如何看拳头宣布取消免费的海克斯宝箱,以后想有皮肤只能靠买?三叶草欧洲码和亚洲码怎么换算

资料显示,朱某兰擅长修复各种乳腺手术后的缺损变形,以及各种乳腺癌术后再造手术等。据《常州日报》此前报道,朱某兰带领的常州二院乳腺外科团队从2005年起开展乳房重塑手术,2016年还联合该院整形科,推出乳房整形门诊。

该书作者郭郭老师结合自身读书和教学的经历,分享了《题解西游》的创作过程。这套书站在学生角度解读《西游记》,并配套了人民文学出版社的大字版《西游记》,同时配有朗诵音频和线上讲解视频。郭郭老师表示,希望孩子们使用“思维陪伴式阅读”法,能够更好地培养兴趣。

TOP6热点:《哪吒之魔童闹海》票房已破 90 亿,进入全球动画电影票房榜前五,有望冲刺全球动画票房第一吗?精品好还是极品好

上海中心气象台2023年08月20日11时50分发布雷电黄色预警信号:受较强雷暴云团影响,预计12小时内全市将发生雷电活动,可能会造成雷电灾害事故,并伴有1小时20-30毫米的短时强降水和7-8级的雷雨大风,请注意防范。

这种沉浸式的观察方式来自他的父母。20世纪40年代,伊莎白在农村做调研时,与农民同吃同住,还经常端着饭碗蹲在地上和农民一起吃饭。面对贫穷落后的中国,这位国际主义战士不仅没有歧视,反而和质朴的中国人民打成一片。

TOP7热点:消息称华为与上汽敲定智选车合作,品牌名初步为「尚界」,面向更年轻化市场,具体情况如何?女生哪些特质最容易吸引男生

直至2021年,徐某和邓某登记复婚,并向上海市徐汇区民政局(下简称徐汇区民政局)提出收养亮亮的申请。徐汇区民政局经评估发现,徐某个人信用部分存在贷记卡呆账和失信被执行人记录,根据《上海市收养评估办法》规定,认定夫妻二人收养能力评估不合格,作出不予收养登记通知。

《健康脱口秀·第三季》向全国各级各类医疗卫生机构的健康科普达人发出邀请。本文图片均为主办方供图

TOP8热点:东契奇首秀,湖人 132:113 击败爵士取得六连胜,如何评价这场比赛?亚洲尺码与欧洲尺码转换表

此次展览中,“百年马利”展区记录了马利品牌从1919年诞生以来至今20件重要事件。“美育之星”、“国货之光”以丰富多样的文献资料从不同侧面展现马利品牌的辉煌历史。“画家之友”展区讲述诸多画家自马利品牌诞生起结下的深厚情谊。马利品牌的历史也是其与中国画家共同成长、相互成就的历史。

“因此,唯一的办法就是彻底瓦解敌对国家的国家机器,并完全保证未来的忠诚。”梅德韦杰夫在文章最后写道,“只有俄罗斯控制前班德拉领土上正在发生和将要发生的一切,才能提供这些保障。我们将做到这一点。”

TOP9热点:24-25 赛季 NBA 常规赛爵士 113:132 湖人,如何评价这场比赛?狂野式到轮式的转换技巧

2005年,浙江省信访总量出现了1992年以来的首次下降,之后一直保持信访量的持续下降。

报道还称,目前特内里费岛火灾的过火面积超过5000公顷。火灾产生的烟雾在该岛各市镇造成不同程度的空气污染。当地政府建议居民避免在户外停留,并且不要进行高强度和时间较长的体力劳动。(总台记者魏帆)

TOP10热点:《哪吒 2 》爆火后,多地争相给哪吒「上户口」,你最认可哪种说法?日本金银瓶1-5

“那是一个合作大于竞争的年代。”柯马凯记得,那时,母亲经常鼓励学习好的学生帮助带动学习差的学生,她还常把需要帮助的学生请到家中答疑解惑。

本文图片均为“上海天气发布”微信公众号图

发布于:厦门同安区