寂寞护士_科技视野_一文读懂DeepSeek及其影响(附利好方寂寞护士向、概念股梳理)

寂寞护士一文读懂DeepSeek及其影响(附利好方寂寞护士向、概念股梳理)

寂寞护士一文读懂DeepSeek及其影响(附利好方寂寞护士向、概念股梳理)

一文读懂DeepSeek及其影响(附利好方寂寞护士向、概念股梳理)

齐齐哈尔市第三十四中学女子排球队图片来源:学校微信公众号

自DeepSeek完成更新以来,其热度始终居高不下。DeepSeek做了哪些创新?何以在技术圈和资本市场造成轰动?它又将产生哪些影响?对于算力的冲击几何?本文将就这些市场关注的问题进行梳理。DeepSeek是什么?做了哪些创新?DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,由幻方量化的创始人梁文锋创立,自2023年7月成立以来专注于大语言模型的深度研发。其创始人梁文锋曾表示:“这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展”、“中国的AI不可能永远跟随,需要有人站到技术的前沿”、“尽管面临竞争压力,DeepSeek仍选择专注在研究和技术上,未做toC应用,也未全面考虑商业化”、“如果目标是做应用,那沿用Llama结构,短平快上产品也是合理选择。但我们的目的是AGI,这意味着我们需要研究新的模型结构。”因此,DeepSeek始终坚持技术创新路线,并开创性地提出多头潜在注意力机制(MLA)和MoE等创新架构,通过结合大规模强化学习、冷启动数据、适当的奖励机制、自进化特性以及高效的训练算法,在数学、代码、自然语言推理等多个任务上,性能比肩OpenAIo-1217模型。DeepSeek何以震撼全球?在AI领域存在着“规模定律”,即模型性能会随着模型参数、训练数据和算力的指数级增长而线性提高。过去几年,AI模型主要通过预训练阶段的规模堆积来提升能力,但这一路径逐渐因数据耗尽和合成数据质量问题而放缓,让市场一度陷入了大模型发展滞缓、陷入瓶颈的怀疑。在这一关键时刻,DeepSeek-R1横空出世,通过精心设计训练流程和应用新算法,极大地提高了算力使用效率,有效解决了产业发展的痛点,仅投入557.6万美元,借助2048块英伟达H800GPU,就完成了性能可对标GPT-4o的模型训练,成本仅为OpenAI同类模型的十分之一,推理成本更是低至每百万Token0.14美元,而OpenAI则高达7.5美元每百万Token,让用户能用更低成本享受到近乎头部模型的体验。DeepSeek的颠覆性意义深远:它打破了以往算力和芯片投资“大力出奇迹”的固有观念,告诉市场:AI竞赛不只是芯片纳米级技术的比拼,而是算法效率、生态活力与政策弹性的多维度较量。同时,通过成本优势和开源策略,实现了一定程度的AI平权:在OpenAI等闭源模型禁止用户蒸馏模型时,DeepSeek成功追赶,并将创新成果全部开源、鼓励业界基于其成果进行蒸馏,或许这才是真正的“OpenAI”。其创始人梁文锋曾表示:“我们希望更多人,哪怕一个小app都可以低成本去用上大模型,而不是技术只掌握在一部分人和公司手中,形成垄断”。在“规模定律”放缓的大背景下,DeepSeek成功追赶OpenAI等全球领先的模型,让中美之间的大模型技术差距进一步缩小,也得以让外资重视起处于估值洼地的中国资产,前期因中美芯片限售估值承压的中国互联网资产价值得到显著提升。高盛发布研报称:DeepSeek的崛起,为中概科技股带来了中长期价值重估的机会;德意志银行表示,2025年将是中国企业在全球崛起的一年,中国股票估值折价的现象将消失。DeepSeek对多领域的影响绝大多数全球AI从业者对于DeepSeek低价策略和开源的反应是:兴奋、激动,因为它大幅降低了AI技术的应用门槛,让下游企业和开发者能够以低成本使用先进的AI技术,将AI行业推动进入了一个更加开放、低成本、高普及率的新阶段。早在之前,其创始人梁文锋就曾表示:“希望构建一种生态,由DeepSeek负责基础模型和前沿创新,其他公司在此基础上开展toB、toC业务”。DeepSeek通过“低成本+高性能+开源”组合,将推动各行业AI应用的快速渗透与商业化落地:主要体现在技术普惠(降低门槛)、效率提升(开发与运营优化)和生态共建(开源社区繁荣)三方面,同时重构全球AI竞争格局,加速端侧智能与行业数字化转型进程。加速AI应用,推动端侧AI落地:推动机器人、消费电子、智能汽车、计算机、传媒等Ai应用与发展,加速影视、广告、社交陪伴等领域的AI+应用落地。DeepSeek低成本与轻量化相结合的特点也将加速端侧AI的推广落地,促进AI硬件的放量,例如消费电子中实现手机端、PC端语音助手等本地化AI功能,对于SoC芯片等有积极影响。助力软件开发、游戏制作等领域:DeepSeek发布有望加速赋能产业,通过其强大的AI能力,有望显著提高开发的效率,助力企业降本增效,提升生产力。智能驾驶领域:DeepSeek通过算法优化,以有限算力开发出性能强劲的模型,表明小算力依靠算法优化也有希望达到世界一流模型的性能水平,R1的诸多优化方法有望为智驾行业所借鉴。数字营销、数字创意等领域:得以使更多企业能够在低成本的情况下自研自身的垂类AI应用,通过直接使用或二次开发开源代码,节省开发时间和人力成本,专注于模型与业务的融合创新。云计算领域:云计算公司集算力供给、大模型研发与AI应用于一体,此前须承受巨大的AI前期投入与应用业绩兑现的时间差,而DeepSeek的技术路线为云计算公司提供了更具性价比的API,得以降本增效。同时,但随着未来大规模应用的指数级增长,市场对于云端服务的需求也将大幅增长,加速企业数字化转型上云,规模效应下云业务利润率有望进一步提升。有业内人士分析称,当前生成式AI尚处于技术发展的早期阶段,单位成本下降是技术快速发展的必然趋势,后续有望进一步降低,届时AI应用和AI终端将随着成本的下降逐渐普及,行业竞争将进入“产品能力竞争”阶段,巨头的流量优势将进一步凸显。DeepSeek对算力的冲击几何?首先,需要说明的是,DeepSeek并没有改变规模定律,"更多计算带来更好模型性能"并未改变,算法突破反而有望促进算力需求正向循环。梁文锋自己也表示:“虽然具体技术方向一直在变,但模型、数据和算力这三者的组合是不变的”、“对研究员来说,对算力的渴求是永无止境的。做了小规模实验后,总想做更大规模的实验。那之后,我们也会有意识地去部署尽可能多的算力”。Deepseek的算力集群放眼全世界也是领先的,如果梁文锋没有超前的眼光部署算力基础设施,也就不会有Deepseek的优秀性能。进一步试想,大厂在训练效率提升之后就会减少投入吗?或许不会,反而可能会是:消化吸收DeepSeek的创新,基于更高效率,投入比DeepSeek更多的算力,追求模型性能的更大提升。借用Anthropic的首席执行官Dario的话来说,“训练越来越智能的模型的经济价值是如此之大,以至于任何成本收益几乎都会立即被吃掉——它们被重新投入到制作更智能的模型中”。算力使用效率提高,一方面意味着AI投入的ROI得以提高,让资本支出投得更加“扎实”,另一方面也意味着使用更多的算力,可能就能把模型能力上限再往上提升,AGI反而更加看到了希望。在巨头的竞争中,谁能率先搭建起规模更大、效率更高的超算集群,谁就能更好地满足用户指数级爆发的需求,在未来竞争中占据优势。近期Deepseek自出圈后用户量暴增导致服务经常性崩溃,而云厂商基于其提前部署的算力,迅速抢占流量和用户,说明AI能力边际的扩张依然需要依赖更大的模型和强大的算力,算力将依然是推动人工智能进步的核心因素之一。因此,微软、Meta、谷歌、甲骨文和亚马逊等巨头在AI基础设施的投入上非但没有放缓,反而更加激进,大超华尔街分析师预期。微软预计全年资本支出将超过800亿美元,重点投资于智能云服务;Meta计划投入600亿至650亿美元,用于核心业务及AI基础设施的升级;谷歌则宣布高达750亿美元的投资计划,主要用于数据中心和AI技术的发展;甲骨文预期资本支出翻倍至约138亿美元,以增强其云服务能力并推动长期收入增长;亚马逊更是预计将资本支出提升至1000亿美元。微软首席执行官纳德拉表示,“杰文斯悖论将再次上演!随着AI变得更加高效和普及,我们将看到它的使用量激增,最终成为一种我们永远无法满足的商品。”杰文斯悖论是一条知名的经济学理论,指当技术的进步导致某种资源的使用更加高效时,消费者或企业对它的使用需求可能会大幅增加,虽然其使用成本降低了,但总消耗最终反而会上升。这样的情况在当前的蒸汽机时代和内燃机时代都曾出现过。最后,DeepSeek爆火后,其他应用出现了大量用户迁移现象,给市场启示是:谁的产品更好,用户就用谁的产品。而由于学术论文的公开、先进模型的开源以及人才的流动,或许会难以出现各方面能力全面领先的大模型,差距短期内难以拉开,竞争会更加激烈。而用户也由此受益,能以更低的成本获取到高质量模型,继而拉动算力的需求。正如东方港湾的但斌所说,“因为DeepSeek的影响,市场对人工智能的未来有了巨大的分歧,但就是因为这种预期差,形成了难得的机会”。DeepSeek的成本真的只有550万美元吗?市场盛传的“550万美元”仅包括DeepSeek-V3的最终训练的部分成本,不包括前期GPU算力投资、架构、算法、数据相关的研究、消融实验、服务器建设与运营的成本。即便如此,鉴于DeepSeek在技术实现上的高效,该成本还是体现出较高的性价比。DeepSeek真的绕开了对NvidiaCUDA的依赖吗?上海交通大学副教授戴国浩表示,DeepSeek采用的PTX指令实际上是位于CUDA驱动层内部的一个组件,仍然依赖于CUDA生态系统,“采用PTX绕过CUDA”的说法是有失偏颇的。风险揭示:以上内容不构成股票推荐及投资建议,个股数据不代表未来表现。 投资有风险,本文不构成任何宣传推介及投资建议。本资料涉及基金的过往业绩不预示其未来表现,基金管理人管理的其他基金的业绩并不构成基金业绩表现的保证,深圳市前海排排网基金销售有限责任公司(“我司”)未以明示、暗示或其他任何方式承诺或预测产品未来收益。本资料所涉产品数据及信息来自基金管理人、托管估值机构或外部数据库等,我司无法对其真实性、准确性、完整性作出实质性判断和保证,投资者须以中国证监会资本市场电子化信息披露平台、基金管理人官方网站及其委托的基金估值核算机构发布的内容为准。投资者应谨慎注意各项风险,认真阅读基金合同、基金产品资料概要等销售文件,充分认识产品的风险收益特征,并根据自身情况做出投资决策,对投资决策自负盈亏。我司不从事任何基金评价业务,相关排行(如有)均为内部评定结果,仅供参考。

koa12jJid0DL9adK+CJ1DK2K393LKASDad

编辑:马连良

TOP1热点:陈晓曾被曝离婚可以净身出户

值得注意的是,就在日本实施半导体制造设备出口管制措施的前一天,7月22日,日本首相岸田文雄就中日关系表态,称“中日关系密不可分”。。

詹德斌表示,尽管执政者可以根据民意调整政策和推进方式,但实际上,尹锡悦政府把率过低视作在野党煽动的结果,因此继续一意孤行的可能性比较大。

TOP2热点:U20

李文庆表示,如果李凯尔有再次回新木新村探亲的打算,会和李家亲戚们商量,考虑再策划一些方式去招待他。

所以,才有了他来报警的。

TOP3热点:护士因拔针出血跪求患者原谅FARMSKINS进不去

据报道,当地时间21日凌晨2点左右,俄军连续第三晚对敖德萨发起空袭,袭击几乎不间断持续了至少90分钟。目击者描述称,“无人机的嗡嗡声回荡在这个港口城市的夜空”。

不是夫妻,他们怎么住到一起了呢?

TOP4热点:美社保局长拒向马斯克交出数据被撤职美国

“这将破坏日本公司的市场拓展,从监管的角度讲,肯定会降低他们的竞争力。”日本大商社丸红商事的中国经济调查总监铃木贵元接受BBC采访时表示,日本国内缺乏一个足够大的芯片市场,这些出口限制对日本芯片设备制造商而言,将是一个打击。

她怎么可能让老郭同时拥有两个小三呢?

TOP5热点:赵露思不用拐杖了来嘛我想要

同样不知道哥哥现状的,还有来自湖南汨罗的奉江。7月18日,他告诉记者,和哥哥最后一次联系是在5月,“他说快救救我,我可能承受不住会自杀。”

7月18日至23日,清华大学党委书记、中国科学院院士邱勇,北京大学校长、中国科学院院士龚旗煌分别带队前往辽宁省考察调研,与辽宁省委书记郝鹏、省长李乐成分别会商,并签署战略合作框架协议。

TOP6热点:陈晓陈妍希离婚СПЕКС少女

随后的几个月里,阿贵偶尔会跟弟弟阿州(化名)联系。“你们都要好好的,跟妈咪说我没事,我会照顾好自己的。”他都这样说。

华中师范大学今年在广西的录取分数线

TOP7热点:敖丙爹地啊他人很好的久久久文化传媒有限

这件事情没准还会因为证据不足被搁置下来,自己也能够逍遥自在的过完后半生。

北京烤鸭、西湖醋鱼、两吃大虾,也都是基辛格1972年陪同时任美国总统尼克松访华时的菜品,满是历史的回味。

TOP8热点:胡歌享受对死亡的思考上边一面亲下边一面膜的功效

国际刑事法院

阿兵的工作收入并不高,

TOP9热点:文化中国行看最美家乡花灯狗配人怎样配马配人呢

她相信老郭早晚会回到她身边的,因为她才是老郭的妻子呀。可是,让她没想到的是老郭竟然被杀死了。

2006年,李春生进京赴公安部任职,从那时起至2013年,李春生在公安部工作了7年时间。

TOP10热点:陈晓赵丽颖 接二搭md0070沈娜娜苏清歌团圆火锅

某县教育局的相关负责人也向记者表示,嘉美2021年在该县的学校厕所集中改造项目中表现良好,项目进行过程中充分考虑到了学校学生的安全问题,施工材料摆放也很规范,施工范围都用两米高的铁皮护栏围起来了。项目配有质检员、监理,学校和监管单位每天都会派人到施工现场查看。

据石英财经网报道,在去年2月俄乌冲突爆发后,莫斯科几乎切断对欧天然气供应,欧洲脆弱的能源安全暴露无遗。为寻求减少对俄罗斯能源的依赖,欧洲去年进口了创纪录数量的光伏组件。预计到2023年底欧盟将囤积100吉瓦的光伏组件。2023年以来,中国对欧光伏组件每月出口量均高于去年同期水平,3月份出口量甚至同比增长51%。中国光伏行业协会数据显示,今年上半年中国光伏产品出口总额初步测算超过290亿美元,同比增长约13%。最大市场欧洲占比约五成,增速超40%

发布于:苏州沧浪区