寂寞护士_科技视野_一文读懂DeepSeek及其影响（附利好方寂寞护士向、概念股梳理）

一文读懂DeepSeek及其影响（附利好方寂寞护士向、概念股梳理）

齐齐哈尔市第三十四中学女子排球队图片来源：学校微信公众号

自DeepSeek完成更新以来，其热度始终居高不下。DeepSeek做了哪些创新？何以在技术圈和资本市场造成轰动？它又将产生哪些影响？对于算力的冲击几何？本文将就这些市场关注的问题进行梳理。DeepSeek是什么？做了哪些创新？DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司，由幻方量化的创始人梁文锋创立，自2023年7月成立以来专注于大语言模型的深度研发。其创始人梁文锋曾表示：“这一波浪潮里，我们的出发点，就不是趁机赚一笔，而是走到技术的前沿，去推动整个生态发展”、“中国的AI不可能永远跟随，需要有人站到技术的前沿”、“尽管面临竞争压力，DeepSeek仍选择专注在研究和技术上，未做toC应用，也未全面考虑商业化”、“如果目标是做应用，那沿用Llama结构，短平快上产品也是合理选择。但我们的目的是AGI，这意味着我们需要研究新的模型结构。”因此，DeepSeek始终坚持技术创新路线，并开创性地提出多头潜在注意力机制(MLA)和MoE等创新架构，通过结合大规模强化学习、冷启动数据、适当的奖励机制、自进化特性以及高效的训练算法，在数学、代码、自然语言推理等多个任务上，性能比肩OpenAIo-1217模型。DeepSeek何以震撼全球？在AI领域存在着“规模定律”，即模型性能会随着模型参数、训练数据和算力的指数级增长而线性提高。过去几年，AI模型主要通过预训练阶段的规模堆积来提升能力，但这一路径逐渐因数据耗尽和合成数据质量问题而放缓，让市场一度陷入了大模型发展滞缓、陷入瓶颈的怀疑。在这一关键时刻，DeepSeek-R1横空出世，通过精心设计训练流程和应用新算法，极大地提高了算力使用效率，有效解决了产业发展的痛点，仅投入557.6万美元，借助2048块英伟达H800GPU，就完成了性能可对标GPT-4o的模型训练，成本仅为OpenAI同类模型的十分之一，推理成本更是低至每百万Token0.14美元，而OpenAI则高达7.5美元每百万Token，让用户能用更低成本享受到近乎头部模型的体验。DeepSeek的颠覆性意义深远：它打破了以往算力和芯片投资“大力出奇迹”的固有观念，告诉市场：AI竞赛不只是芯片纳米级技术的比拼，而是算法效率、生态活力与政策弹性的多维度较量。同时，通过成本优势和开源策略，实现了一定程度的AI平权：在OpenAI等闭源模型禁止用户蒸馏模型时，DeepSeek成功追赶，并将创新成果全部开源、鼓励业界基于其成果进行蒸馏，或许这才是真正的“OpenAI”。其创始人梁文锋曾表示：“我们希望更多人，哪怕一个小app都可以低成本去用上大模型，而不是技术只掌握在一部分人和公司手中，形成垄断”。在“规模定律”放缓的大背景下，DeepSeek成功追赶OpenAI等全球领先的模型，让中美之间的大模型技术差距进一步缩小，也得以让外资重视起处于估值洼地的中国资产，前期因中美芯片限售估值承压的中国互联网资产价值得到显著提升。高盛发布研报称：DeepSeek的崛起，为中概科技股带来了中长期价值重估的机会；德意志银行表示，2025年将是中国企业在全球崛起的一年，中国股票估值折价的现象将消失。DeepSeek对多领域的影响绝大多数全球AI从业者对于DeepSeek低价策略和开源的反应是：兴奋、激动，因为它大幅降低了AI技术的应用门槛，让下游企业和开发者能够以低成本使用先进的AI技术，将AI行业推动进入了一个更加开放、低成本、高普及率的新阶段。早在之前，其创始人梁文锋就曾表示：“希望构建一种生态，由DeepSeek负责基础模型和前沿创新，其他公司在此基础上开展toB、toC业务”。DeepSeek通过“低成本+高性能+开源”组合，将推动各行业AI应用的快速渗透与商业化落地：主要体现在技术普惠（降低门槛）、效率提升（开发与运营优化）和生态共建（开源社区繁荣）三方面，同时重构全球AI竞争格局，加速端侧智能与行业数字化转型进程。加速AI应用，推动端侧AI落地：推动机器人、消费电子、智能汽车、计算机、传媒等Ai应用与发展，加速影视、广告、社交陪伴等领域的AI+应用落地。DeepSeek低成本与轻量化相结合的特点也将加速端侧AI的推广落地，促进AI硬件的放量，例如消费电子中实现手机端、PC端语音助手等本地化AI功能，对于SoC芯片等有积极影响。助力软件开发、游戏制作等领域：DeepSeek发布有望加速赋能产业，通过其强大的AI能力，有望显著提高开发的效率，助力企业降本增效，提升生产力。智能驾驶领域：DeepSeek通过算法优化，以有限算力开发出性能强劲的模型，表明小算力依靠算法优化也有希望达到世界一流模型的性能水平，R1的诸多优化方法有望为智驾行业所借鉴。数字营销、数字创意等领域：得以使更多企业能够在低成本的情况下自研自身的垂类AI应用，通过直接使用或二次开发开源代码，节省开发时间和人力成本，专注于模型与业务的融合创新。云计算领域：云计算公司集算力供给、大模型研发与AI应用于一体，此前须承受巨大的AI前期投入与应用业绩兑现的时间差，而DeepSeek的技术路线为云计算公司提供了更具性价比的API，得以降本增效。同时，但随着未来大规模应用的指数级增长，市场对于云端服务的需求也将大幅增长，加速企业数字化转型上云，规模效应下云业务利润率有望进一步提升。有业内人士分析称，当前生成式AI尚处于技术发展的早期阶段，单位成本下降是技术快速发展的必然趋势，后续有望进一步降低，届时AI应用和AI终端将随着成本的下降逐渐普及，行业竞争将进入“产品能力竞争”阶段，巨头的流量优势将进一步凸显。DeepSeek对算力的冲击几何？首先，需要说明的是，DeepSeek并没有改变规模定律，"更多计算带来更好模型性能"并未改变，算法突破反而有望促进算力需求正向循环。梁文锋自己也表示：“虽然具体技术方向一直在变，但模型、数据和算力这三者的组合是不变的”、“对研究员来说，对算力的渴求是永无止境的。做了小规模实验后，总想做更大规模的实验。那之后，我们也会有意识地去部署尽可能多的算力”。Deepseek的算力集群放眼全世界也是领先的，如果梁文锋没有超前的眼光部署算力基础设施，也就不会有Deepseek的优秀性能。进一步试想，大厂在训练效率提升之后就会减少投入吗？或许不会，反而可能会是：消化吸收DeepSeek的创新，基于更高效率，投入比DeepSeek更多的算力，追求模型性能的更大提升。借用Anthropic的首席执行官Dario的话来说，“训练越来越智能的模型的经济价值是如此之大，以至于任何成本收益几乎都会立即被吃掉——它们被重新投入到制作更智能的模型中”。算力使用效率提高，一方面意味着AI投入的ROI得以提高，让资本支出投得更加“扎实”，另一方面也意味着使用更多的算力，可能就能把模型能力上限再往上提升，AGI反而更加看到了希望。在巨头的竞争中，谁能率先搭建起规模更大、效率更高的超算集群，谁就能更好地满足用户指数级爆发的需求，在未来竞争中占据优势。近期Deepseek自出圈后用户量暴增导致服务经常性崩溃，而云厂商基于其提前部署的算力，迅速抢占流量和用户，说明AI能力边际的扩张依然需要依赖更大的模型和强大的算力，算力将依然是推动人工智能进步的核心因素之一。因此，微软、Meta、谷歌、甲骨文和亚马逊等巨头在AI基础设施的投入上非但没有放缓，反而更加激进，大超华尔街分析师预期。微软预计全年资本支出将超过800亿美元，重点投资于智能云服务；Meta计划投入600亿至650亿美元，用于核心业务及AI基础设施的升级；谷歌则宣布高达750亿美元的投资计划，主要用于数据中心和AI技术的发展；甲骨文预期资本支出翻倍至约138亿美元，以增强其云服务能力并推动长期收入增长；亚马逊更是预计将资本支出提升至1000亿美元。微软首席执行官纳德拉表示，“杰文斯悖论将再次上演！随着AI变得更加高效和普及，我们将看到它的使用量激增，最终成为一种我们永远无法满足的商品。”杰文斯悖论是一条知名的经济学理论，指当技术的进步导致某种资源的使用更加高效时，消费者或企业对它的使用需求可能会大幅增加，虽然其使用成本降低了，但总消耗最终反而会上升。这样的情况在当前的蒸汽机时代和内燃机时代都曾出现过。最后，DeepSeek爆火后，其他应用出现了大量用户迁移现象，给市场启示是：谁的产品更好，用户就用谁的产品。而由于学术论文的公开、先进模型的开源以及人才的流动，或许会难以出现各方面能力全面领先的大模型，差距短期内难以拉开，竞争会更加激烈。而用户也由此受益，能以更低的成本获取到高质量模型，继而拉动算力的需求。正如东方港湾的但斌所说，“因为DeepSeek的影响，市场对人工智能的未来有了巨大的分歧，但就是因为这种预期差，形成了难得的机会”。DeepSeek的成本真的只有550万美元吗？市场盛传的“550万美元”仅包括DeepSeek-V3的最终训练的部分成本，不包括前期GPU算力投资、架构、算法、数据相关的研究、消融实验、服务器建设与运营的成本。即便如此，鉴于DeepSeek在技术实现上的高效，该成本还是体现出较高的性价比。DeepSeek真的绕开了对NvidiaCUDA的依赖吗？上海交通大学副教授戴国浩表示，DeepSeek采用的PTX指令实际上是位于CUDA驱动层内部的一个组件，仍然依赖于CUDA生态系统，“采用PTX绕过CUDA”的说法是有失偏颇的。风险揭示：以上内容不构成股票推荐及投资建议，个股数据不代表未来表现。投资有风险，本文不构成任何宣传推介及投资建议。本资料涉及基金的过往业绩不预示其未来表现，基金管理人管理的其他基金的业绩并不构成基金业绩表现的保证，深圳市前海排排网基金销售有限责任公司（“我司”）未以明示、暗示或其他任何方式承诺或预测产品未来收益。本资料所涉产品数据及信息来自基金管理人、托管估值机构或外部数据库等，我司无法对其真实性、准确性、完整性作出实质性判断和保证，投资者须以中国证监会资本市场电子化信息披露平台、基金管理人官方网站及其委托的基金估值核算机构发布的内容为准。投资者应谨慎注意各项风险，认真阅读基金合同、基金产品资料概要等销售文件，充分认识产品的风险收益特征，并根据自身情况做出投资决策，对投资决策自负盈亏。我司不从事任何基金评价业务，相关排行（如有）均为内部评定结果，仅供参考。