500DeepSeek 反思潮:AGI 既500被重新审视,又被持续低估_ZAKER新闻
DeepSeek 反思潮:AGI 既500被重新审视,又被持续低估_ZAKER新闻
近日,多只上半年表现突出的权益
2 月很有意思。一、DeepSeek 反思潮在 DeepSeek 的集体反思潮中,无论是大厂内部的 "AGI 创业团队 "、还是 AGI 的明星创业公司,都进行了战略调整。很显然,DeepSeek 的暴击让整个行业都进行了一次深刻的反思,值得注意的几个变化是:首先,大模型创业公司重新将技术突破提升到一个新的高度、超越产品更新成为公司战略发展的优先级。据近日与张予彤接触过的 VC 反馈,DeepSeek 不花一分钱投流的崛起启示了 AGI 的技术高度,也让 Moonshot 反思了过去一年类互联网打法、过度重视产品投流的策略局限性。在未来的一年,Moonshot 要将基础模型的突破作为重点,将更多资源投到技术而非研发上。事实上,这不仅仅是月之暗面的结论,也是这波 AGI 创业潮中卡技术生态位的大模型公司的普遍转变。与此相对应的,是产品团队的资源比重下降,因为 DeepSeek 的成功已经侧面证明了:AGI 时代可能不需要产品经理,也不需要投流,只要技术实力提升后就会有用户增长。2024 年的投流大战,以 DeepSeek 不花一分钱、DAU 最高时达 4000 万落下帷幕,而受创最重的自然是投流团队,因为钱相当于白花了。投流越多、伤害越大,如 Moonshot;投流越少,伤害越小,如 MiniMax。据 AI 科技评论获悉,MiniMax 前产品一号位离职的原因之一,就是曾与创始人在投流上发生分歧。MiniMax 的组织架构之前是互联网打法,按照不同产品进行分组,产品团队一度达到 200 人,但 2024 年年中开始就一直在调整产品团队,接下来可能会进一步裁减产品人员。雷峰网其次,是字节与腾讯的攻守异位,以及字节大模型技术团队的架构调整。过去一周,腾讯元宝接入 DeepSeek 后在中国区苹果免费 APP 下载排行榜上超过豆包,排名第二、仅次于 DeepSeek。在 "DeepSeek+" 的风潮下,相比百度、阿里、字节等有技术包袱的大厂来说,腾讯的元宝与微信等应用迅速抓住了机会,毫无负担地接入了 DeepSeek,一下子由过去两年的被动防守转为主动出击,变守为攻,扭转了局势。业内周知,在过去的两年,腾讯在大模型、AIGC 相关技术与产品上虽然努力追赶,但始终不温不火。又由于将算力与人才等资源更多投入基础模型,文生视频等方向的研究资源被影响,团队核心骨干从腾讯流向快手、字节等团队。可以说,DeepSeek 救了腾讯大模型一把。也因此,有业内人士认为:基础模型的研究最终只需要 DeepSeek 一家即可。随之引发的,是近日传出的大模型公司有老股东开始张罗退股的声音,认为 " 智谱、阶跃甚至字节、阿里等公司的大模型都没戏了 "。——对于这种声音,笔者不敢苟同,认为应该持续观望。有一个比喻能很好地形容当前中国大模型创业潮的格局:一个富二代学霸做了一份接近满分的卷子,并把答案公布了出来。但这份答案的学习有一定的资源成本与面子成本,另一个能承担起这两种成本的富二代学渣直接拿来抄了、也考了接近满分的成绩。现在留下一群从农村通过赞助入学、平时考七八十分的学生,以及同是富二代但努力方向错了的学生,不知所措。他们终将认识到,开放社会的竞争不一定公平,但一定残酷。打破这种结构性困境很难,或许需要 " 一命二运三风水四积阴德五读书 ",但他们没有其他选择。回到现实,字节的大模型团队进行调整,也是因为 AGI 的竞争格局发生了变化—— DeepSeek 冲出来之前,业内几乎所有人都在夸字节的豆包,豆包也上升十分迅猛,给 kimi 造成极大的围剿;但 DeepSeek 霸屏整个春节后,字节意识到,AGI 仍是一个高度的果实,必须换一个更能打的将领。据 AI 科技评论验证,此前字节的基础模型技术研究由朱文佳带领,春节后进行了一次大的人员调整,基础模型技术研发的一号位换成了由吴永辉,黄文灏等在 2024 年新加入的大模型骨干都向吴永辉汇报,而朱文佳则转向了模型应用一号位,吴永辉与朱文佳都向梁汝波汇报。经 AI 科技评论梳理,2023 年字节刚组建大模型团队时,团队人员主要来自字节内部,包括搜索、抖音、西瓜、TikTok 等等多条知名业务线,在字节过往产品上有过大大小小的胜仗,朱文佳下面各个小组中一号位人选从外面招入的人才并不多。从 2024 年年中开始,越来越多 AGI 方向的知名人才被招入字节,团队开始换血。据知情人士分析,这背后的原因是:朱文佳等人来自搜推广技术背景,而大模型是新的范式,两者不一定适合。字节、MiniMax 等公司此前低估 RL 技术路线就是一个例证。吴永辉代替朱文佳成为基础模型研究一号位,意味着字节换血的决心更彻底。雷峰网吴永辉此前在谷歌的职级仅次于 Jeff Dean,是谷歌 Gemini 的核心贡献者之一。而据几位硅谷华人的信源,吴永辉擅长模型工程。谷歌自 2017 年发布 Transformer 后一直在大模型赛道上持续创新,且谷歌研究大模型一直是从底层框架、算力到上层算法的系统性推进,从知识面上吴永辉确更适合大模型技术一号位的角色。(谷歌 Gemini 是否被低估?欢迎感兴趣的读者添加作者微信 Fiona190913 交流)据知情人士透露,朱文佳此前在带领字节大模型技术研发时,在人才任用上更重用以往一起打过仗的亲信乔木等人,同时在大模型基础研究的创新 idea 采用上不够开放。这背后的逻辑不难理解:AGI 的技术有极高不确定性、用熟悉的队友能减少沟通成本。如果 AGI 是一个很低的桃子," 钱多人傻 " 的打法也许可以,但事实或许并非如此。据了解,新加入字节的技术人员曾向朱文佳提过诸如 SPPO 等强化学习方向、火星优化器等高效训练方向的技术方案," 一些方案明明自己验证了 work、但被朱文佳移交给身边的人验证后被反馈不 work 而弃掉 "。此前字节内部赛马文生视频,其他团队赛赢,但后续成果被朱文佳划到了 Seed 团队。(更多字节大模型内部的研究细节,欢迎天街作者微信 Fiona190913 交流)大模型是一项有门槛的创新技术,无论在大厂还是创业公司,实际上都需要创业者的心态。第一批低估 AGI 的人已经被摁倒,但并非所有人都吸取了教训。雷峰网二、AGI 的壁垒在哪?" 算法是没有壁垒的。" 一位大模型 VC 这样评论道。与此同时,还有相似的声音:"DeepSeek 现象只是昙花一现,过 6 个月就会被追上 ",以及 " 大模型创业公司必然会死,最后赢家只有 DeepSeek 与大厂,你看腾讯元宝 "。笔者认为,在下论断之前,首先要回答一个问题:DeepSeek 已经实现终极 AGI 了吗?答案显然是否定的,即使是 DeepSeek 官方都承认,R1 模型仍有一些致命缺陷,比如通用能力不足、语言混淆、提示词敏感以及软件工程能力不足。如果这个问题达成了共识,那么我们就要思考下一层:第一,DeepSeek 是不是一定能解决 AGI 的所有技术问题?第二,DeepSeek 是不是只需一家之力就能实现终极 AGI?第三,中国是不是只有 DeepSeek 一家有实力解决 AGI 的各个技术问题?同样以腾讯元宝为例。虽然元宝接入 DeepSeek 后可以赢得一时的胜利,但没有人能保证 DeepSeek 永远满分。如果有一天 DeepSeek 不开卷、竞争的规则被改写,又将攻守异位。对于上述问题,笔者均持怀疑态度,原因很简单:DeepSeek 并非聚集了中国乃至全球所有的 AGI 技术人才。即使曾经明星如云的 OpenAI,也因为 2023、2024 年经历了大批核心人才出走,发展受阻。关于 AGI,如果不将其当成只是 DeepSeek 一家的责任,而是作为整个 AI 行业的必然终局,那么就不难有一种朴素的感觉:AGI 的大航海,需要的不只是一个 "DeepSeek",也不会只有一个 "DeepSeek"。AGI 是一个行业,而不是一个产品。在 2 月的交流中,笔者总结,造成 AGI 从业者这种 " 既重视又低估 " 的矛盾心理的一个重要原因,或许是互联网思维的惯性。经历过互联网大战的从业者向 AI 科技评论举例," 互联网产品就是竞争到最后往往就是只有一家胜出,比如出行大战、3Q 大战等等。" 但笔者认为,这种类比不太恰当,因为互联网产品的技术如搜推广从谷歌开始、再到国内时,大体的技术天花板已经确定,而 DeepSeek 证明了 AGI 的天花板比 OpenAI 所取得的成绩还高。与 AGI 或大模型能在同一个层面类比的技术分支,或许用自动驾驶的 L4、英伟达芯片等高难度的技术来类比更合适。虽然 L4 至今没有实现,但自动驾驶技术从 L2 到 L4 的过程中曾衍生了不同维度的产品商业化(如扫地机器人),同样,AGI 也是一个逐步取得胜利、逐步催生商业技术产品的过程。有些团队本就不具备竞争 AGI 的技术实力,但这并不能推断出 "DeepSeek 是唯一能竞争 AGI 的创业团队 " 或 " 中国只需要一家 AGI 公司 " 的结论。哪怕是海外的各家基础模型,也在能力上各有分工,如 GPT 更擅长听指令、Claude 更擅长代码。再回顾更大的行业规律:如果说搜广推技术由谷歌开启、字节抖音推至巅峰,那么大模型技术由 OpenAI 开启,由将由谁推至巅峰?互联网时代经历了 20 年才得出答案、中间也经历了许多故事,那么 AGI 时代也不可能只在 2 年内验证最初的赢家与最后的赢家。那么,AGI 的壁垒在哪?笔者认为,AGI 的壁垒实际是:算法的优势、技术的创新虽然无法构成坚不可摧的壁垒,但可以赢得时间差。以月之暗面为例。事实上,Moonshot 与 DeepSeek 都是在 2023 年的上半年成立、前后相差只有一个月。在 2021 年智源的 " 悟道 " 大模型项目中,杨植麟也是悟道 2.0 大模型的核心开发者之一,从底层 Transformer 到上层大模型的算法训练都有完整、系统的研究背书。相比之下,DeepSeek 创始团队、包括梁文锋虽是计算机专业背景,但在 NLP、Transformer 与预训练等大模型的关键技术上与 Moonshot 团队必然存在技术学习的时间差。如果以 Moonshot 在成立时就具备训练千亿大模型的能力开始算起,到 DeepSeek 在 2024 年 5 月发布 V2,那么这个时间差粗略计算大约是 1 年;如果严格考虑 V2 训练成本大幅降低的研发时间,这个时间差也至少是 6 个月以上。但由于 Moonshot 在过去两年更重视产品增长、而非基础模型的底层技术创新,Moonshot 与 DeepSeek 的基础模型时间差也从 2023 年 "DeepSeek 至少比 Moonshot 落后半年 " 变成了 2025 年 "Moonshot 至少比 DeepSeek 落后 XXX 年 "。在互联网思维的过度指导下,前后相减,Moonshot 至少失去了一年的优势,主动变被动。据知情人士透露,DeepSeek 内部计划今年 3 月发布 V3.5,6 月之前发布 V4。换言之,假设其他团队的基础模型能在 6 月赶上 V3 与 R1,作为先行者,DeepSeek 已经利用时间差赢得了领先的技术研发期,以及这半年内的生态护城河。模型的效果容易提升,但生态不容易割据。是坐享其成,还是参与竞争,亦或看清局势、早早转向自身的优势所在,不容易判断。尽管 DeepSeek 当前风头正盛,但 AGI 仍然是一个挂在高处的果子,需要持续的底层技术创新。在跋涉的过程中,一定会有人退出,无论是 VC 也好、创业者也好、技术人员也好,但无论如何,这条路上不会只有 DeepSeek,也希望不会只有 DeepSeek。koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:李宗仁
TOP1热点:全红婵跳经常平摔进水里
另外,德国媒体Automobilwoche此前也报道称,为了应对中国竞争日益激烈的电动汽车竞争,大众子公司奥迪正在从中国当地寻找电动平台合作伙伴,以缩短其车型的开发时间。。
TOP2热点:樊振东低谷时看足球赛激励自己
“但金融环境的放松、房地产市场的反弹以及建厂热持续均表明美国经济将继续增长,尽管增速低于趋势水平。”
此外,53号文中提及妨碍市场准入和退出的政策,如要求企业必须在某地登记注册,对企业跨区域经营或者迁出设置障碍等也属于政策清理的范围。
TOP3热点:孔笙肖战开机同框美国人与畜禽CROPROATI1...
2023年7月12日
三是,半导体产业链机会:根据公开信息,半导体产业下行周期正接近底部,预期2023年下半年可能会迎来拐点,部分产业链环节有望率先走出低谷。基金将继续密切跟踪产业变化,及时在合适的时候介入。
TOP4热点:狂飙兄弟被爆出轨可以免费看胡桃大战史莱姆
与外资形成鲜明对比的是,印度国内以国有保险巨头LifeInsuranceCorporationofIndia(LIC)和共同基金为首的
TOP5热点:重庆辟谣某工厂煤气泄露引发爆炸键去除衣物的软件免费
三是,半导体产业链机会:根据公开信息,半导体产业下行周期正接近底部,预期2023年下半年可能会迎来拐点,部分产业链环节有望率先走出低谷。基金将继续密切跟踪产业变化,及时在合适的时候介入。
TOP6热点:首个超级月亮WWW.GCRCCS.COM
推动钢铁等重点行业加快联合重组
TOP7热点:马来西亚女子被丈夫推下悬崖HD100%VIEDIOSI
欧陆通回复称,公司结合发展战略和业务规划,充分考虑了目前各业务板块发展阶段及具体经营情况后,决定更改募投项目。服务器电源是公司长期发展战略重点之一,近几年公司服务器电源业务维持高速增长态势,业务规模处于持续扩张阶段,为满足公司数据中心相关业务快速发展的需要,本次募投项目规划投入建设数据中心电源生产线。在产能规划方面,公司结合发展战略、业务布局、市场情况和客户订单等因素,合理、有序进行产能布局和建设。
从17日起,国投瑞银、天弘基金、平安基金等多家公募旗下产品正式实施降费规定。
TOP8热点:周深只字不提唱分手后遗症来嘛我想要
“电力领域有发电端、输电端、配网端、用电侧,我们认为市场化带来的更大变化会在用电服务领域。”翁朝伟说。于是,朗新切入了用电服务领域的应用解决方案赛道。目前,朗新的电力客户覆盖全国22个省/自治区/直辖市,服务超过2.7亿电力终端用户。
仅张华宇一人,就利用职权违规安排儿子、女婿、弟弟等亲友数十人到光大系任职,为多人在职务晋升、工作调动等方面谋取利益。
TOP9热点:张艺兴唱了晴天中国XXXXXL196_may18_
需求恢复不及往年同期,供需格局未出现明显改善
高温天出游大汗淋漓之际,一杯冷饮入口,能瞬间令人身心透凉、神清气爽,也因此催生了保冷杯的热卖。虎牌运动保冷杯是暑期出游随时随地享用冰饮的好帮手,专业级保冷、可盛放碳酸饮料,500ml体量适宜户外携带。
TOP10热点:游泳教练谈先天健身圣体女孩数学课代表穿着蕾丝吊带背心
数据不离场过程看得见
此外,53号文中提及妨碍市场准入和退出的政策,如要求企业必须在某地登记注册,对企业跨区域经营或者迁出设置障碍等也属于政策清理的范围。