696969c大但人文艺术作品杨植麟回应不了一切_ZAKER696969c大但人文艺术作品新闻
杨植麟回应不了一切_ZAKER696969c大但人文艺术作品新闻
优化城乡多层级消费载体。通过建设国际消费中心城市、高品质步行街、一刻钟便民生活圈等,打造核心商圈、区域商圈、社区商圈多层次商圈体系,提升城市消费活跃度。完善县域商业网点和物流设施布局,推动释放县域与农村消费升级潜力。
文|邓咏仪编辑|苏建勋 进入 2024 年,中国大模型公司面对的牌局愈发艰难。一方面,在 2023 年快速入局,获得了大额融资、高昂估值的 " 六小虎 " 们,面对着各种声音—— AI 应用同质化、尚未跑通的商业模式。在另一面,以 OpenAI 为首的顶级模型迭代速度放缓,GPT-5 迟迟未发,近期整个行业都在讨论:大模型的 Scaling Law 是否失效了?但久未露面的月之暗面创始人杨植麟表示:Scaling Law 依旧有效,只是 Scale 的东西变了。△月之暗面创始人杨植麟 图源:作者拍摄11 月 16 日,月之暗面正式发布新数学模型 K0-math。这是一个专注于计算能力的数学模型。在 Demo 中,K0-math 不仅展示了能够解决数学竞赛中的高难度数学题,更难得的,是能够展现解题时的分布思考步骤——从拿到题目,到拆分步骤思考。在遇到解题步骤出现错误时,K0-math 还能够自己反思思考的逻辑是否有误,返回到特定的步骤重新展开推理。月之暗面公布的基准测试显示,Kimi k0-math 的数学能力,可对标全球领先的 OpenAI o1 中可公开使用的两个模型:o1-mini 和 o1-preview。杨植麟还专门强调,为了让和 o1 的对比足够公平,月之暗面团队使用了不同种类的测试集进行实时测试。△ K0-math 模型基准测试结果 图源:作者拍摄在中考、高考、考研以及包含入门竞赛题的 MATH 等 4 个数学基准测试中,k0-math 初代模型成绩超过 o1-mini 和 o1-preview 模型。在两个难度更大的竞赛级别的数学题库—— OMNI-MATH 和 AIME 基准测试中,k0-math 初代模型的表现,则分别达到了 o1-mini 最高成绩的 90% 和 83%。仅仅在一个月前,Kimi 刚刚发布最新版本 "Kimi 探索版 ",将以 CoT(思维链为主)的能力放到了模型当中。Kimi 探索版的 AI 自主搜索能力,可以模拟人类的推理思考过程,多级分解复杂问题,执行深度搜索,并即时反思改进结果。无论是 Kimi 探索版还是如今的 K0-math,其释放的信息都是类似的:不断提升模型的智力、思考水平。这也是面对以 OpenAI o1 为首的顶尖模型,Kimi 迈出的追赶第一步。不过杨植麟也坦承,如今的 K0-math 还有不少局限性。比如,对于高考难题、IMO 数学竞赛等等难题,K0-math 还会有一定概率做错。有时候,模型也会过度思考——对于 1+1=2 类的简单数学题,模型可能会花没有必要的步骤去反复验证答案,甚至会 " 猜答案 ",但不能展现为什么可以得出正确的答案。作为国内 AI 初创公司中 " 技术理想主义派 " 的代表,杨植麟本人曾多次强调 Scaling Law(缩放定律,大模型最重要的技术原理)的意义和重要性。但现在,他也明确表示行业范式正在发生改变:从原来的扩大计算和参数规模,到如今的强化学习为主的技术路线,着重提升模型智力水平。"AI 的发展就像荡秋千,我们会在两种状态之间来回切换:有时候,算法、数据都很 ready 了,但是算力不够,我们要做的就是加算力;但今天我们发现,不断扩大算力规模已经不一定能直接解决问题了,所以这时就需要通过改变算法,来突破这个瓶颈。"杨植麟解释。数学模型 K0-math 之所以选择在今天发布,也有其特殊意义:11 月 16 日,是月之暗面第一个产品 Kimi Chat 的一周年纪念日。过去两年里,月之暗面是国内最受关注的 AI 初创公司之一。经历了 2023 年的 Kimi 助手爆火,到 2024 年的极速投流增长、近期的仲裁风波,这个团队一直处于风口浪尖之上,如同在迷雾中穿行。但现在,月暗显然并不打算回应一切。在发布会中,杨植麟只讲新模型和技术相关的问题,并简单地公布了一个数字:截至 2024 年 10 月,Kimi 的月活用户已经达到 3600 万。△ Kimi 最新用户数据 图源:作者拍摄" 我仍然保持更乐观的心态。" 杨植麟预测,行业范式转向,并不意味着以扩大规模为主的预训练模式完全失灵——顶尖模型再未来半代到一代,还能释放出预训练的许多潜力。而在模型的思考能力进一步提升后,这也意味着大模型能够进一步落地,解决更多领域内的专有任务。以下为杨植麟在发布会中的更多发言与回应,经《智能涌现》编辑整理:AI 的发展就像荡秋千,本质上都要跟 Scaling 做好朋友Q:转向强化学习路线之后,数据会不会成为模型迭代的比较大的挑战?杨植麟:这确实是强化学习路线的核心问题。以前我们做下一个字段预测的时候,通常用的是静态数据,我们对数据的过滤、打分、筛选,这些技术都比较成熟。但在强化学习路线上,所有的数据都是自己生成的(比如一些思考过程)。模型思考的时候,其实需要知道想法是对还是错,这会对模型的奖励模型提出更高的要求。我们还要做很多对齐的工作,一定程度可以抑制这些问题。Q:在模型迭代的过程里,无论是之前的扩大算力路线,还是说强化学习上,怎么进行平衡?杨植麟:我觉得 AI 的发展就是一个荡秋千的过程,就是你会在两种状态之间来回这个切换一种状态。如果你的算法、数据非常 ready,但是算力不够,那么你要做的事情就是做更多的工程,把 Infra 做得更好,然后它就能够持续的提升。从 Transformer 诞生到 GPT 4,我觉得基本上其实更多的矛盾是怎么能够 Scale,在算法和数据上它可能没有本质的问题。但今天当 Scale 得差不多的时候,你会发现加更多算力可能并不一定能直接解决的问题,核心是高质量的数据就没有那么多了,小几十 T 的 token,这就是人类互联网积累了 20 多年的上限。所以我们需要通过算法的改变,让这个东西不会成为瓶颈。所有的好算法,都是和 Scaling 做朋友,让它释放更大的潜力。我们在很早就开始做这个强化学习相关的东西,我觉得这是接下来很重要的一个趋势了,通过这种方式改变目标函数、学习的方式,让他们持续 Scale。Q:非 Transformer 路线会不会解决这种问题?杨植麟:不会,因为它本身不是 Architecture 的问题,它是一个学习算法或者是没有学习目标的问题。Architecture 我觉得没有本质的问题。Q:关于推理成本,数学版上线到 Kimi 探索版之后,是用户可以去选择不同的模型,还是你们会根据提问来分配?以及,你们现在的主要模式是打赏,而不是订阅,怎么平衡成本问题?杨植麟:我们接下来的版本大概率会让用户自己去选择。早期通过这种方式可以更好的分配或者更好的满足用户的预期,我们也不想让它 1+1 等于多少,想半天,所以我觉得早期可能会用这样的方案。但最终,这可能还是一个技术问题。一,我们能动态的给它分配最优算力,模型足够聪明的话,它就会知道什么样的问题匹配什么样的思考时间,和人一样,不会 "1+1" 的问题也想半天。二,成本也是不断下降的过程。比如说今年你如果达到去年 GPT4 模型的水平,你可能只需要十几 B 的参数就能做到,去年可能需要一百多 B。所以我觉得觉得整个行业先做大或者做小,是这样的普遍规律。Q:现在 AI 圈子会不会被 Scaling Law 这件事限制住了?杨植麟:我比较乐观一点。核心就在于原来你用静态数据集,静态数据集其实是比较简单粗暴的使用方式,现在用强化学习的方式很多情况下是有人在参与这个过程的。比如,你标 100 条数据,你就能产生非常大的作用,剩下的都是模型在自己思考,我觉得以后更多的会用这种方式解决。从做法上来看,(强化学习路线)确定性是比较高的,很多时候的问题在于怎么真正把(模型)调出来,我觉得上限是很高的。Q:你去年说长文本是登月的第一步,你觉得数学模型和深度推理是第几步?杨植麟:就是第二步。Q:预训练的 Scale 现在都觉得遇到瓶颈了,美国遇到瓶颈以后你觉得对中美大模型的格局的影响是什么?你觉得差距是变大还是变小?杨植麟:我一直觉得,这个差距相对是一个常数,对我们来说它有可能是一个好事。假设你一直 pretrain,你的预算今年 1B、明年 10B 或者 100B,它不一定可持续。当然你做 Post-train(后训练)也要 Scaling,只是说你 Scaling 的起点很低。可能很长一段时间,你的算力就不会是瓶颈,这个时候创新能力是更重要的。在这种情况下,我觉得对我们反而是一个优势。Q:之前发的深度推理,还有包括你今天说的数学模型,它离普通用户是比较远的功能吗?你怎么看这个功能和用户的关系?杨植麟:其实也不远。我觉得是两个方面的价值,第一个方面,数学模型今天在教育产品上其实有非常大的价值,在我们整体的流量里,也起到很重要的作用。第二个,我觉得它是技术上的迭代和验证。以及我们可以把这个技术去放在更多的场景里,比如我们刚刚说的探索版去做很多的搜索,我觉得它会有两层这样的含义。保持单一产品形态,保持卡和人比例最高Q:现在都在讨论 AI 应用的问题,Super App 还没有出现,一大批的 AI 应用又非常同质化,你怎么看?杨植麟:我觉得 Super App 已经出现了,ChatGPT 已经有超过 5 亿的月活,它是不是超级应用?至少半个吧,这个问题已经很大程度上被验证了。哪怕像 CharacterAI 这种产品,一开始用户量也蛮多,但后面很难破圈。在这个过程里,我们也会根据美国市场的情况,去判断哪个业务最后做得最大、做成的概率更高。我们还是会聚焦在我们认为上限最高的事情,而且跟我们 AIG 的 misson 也最相关。Q:现在整个行业都有出现 AI 创业公司被收购,以及人才出走、回流大厂的现象,你怎么看待?杨植麟:这个问题我们没有遇到,但可能有一些别的公司遇到。我觉得倒也正常,因为行业发展进入了一个新的阶段,它从一开始有很多公司在做,变成了现在少一点的公司在做。接下来大家做的东西会逐渐不一样,我觉得这是必然的规律。有一些公司做不下去了,就会产生这些问题,我觉得这个是行业发展的规律。Q:你们很少谈到模型训练上的情况,现在你们预训练的情况是怎么样的?杨植麟:我先说第一个问题,我觉得预训练还有空间,大概半代到一代的模型,这个空间会在明年释放出来。明年,我觉得领先的模型会把预训练做到一个比较极致的阶段。但是我们判断,接下来最重点的东西会在强化学习上,就是范式上会产生一些变化。本质上,它还是 Scaling,并不是不用 Scale,只是说你会通过不同的方式去 Scale,这是我们的判断。谈未来、竞争、出海Q:Sora 马上就要发产品了,你们什么时候发多模态产品?怎么看多模态这件事?杨植麟:我们也做,我们几个多模态的能力在内测。关于多模态,我觉得 AI 接下来最重要的是思考和交互这两个能力,思考的重要性远大于交互。不是说交互不重要,而是思考会决定上限。交互是一个必要条件,比如说 Vision(视觉)的,如果没有 Vision 的能力,那就没法做交互。但思考是这样的——你就看要做的这个任务,标注任务的难度有多大,你到底需要一个博士去标?还是每个人都可以标?哪个东西更难找到这样的人?那这个东西就是 AI 的上限。Q:怎么看和豆包等一系列 AI 应用的竞争?杨植麟::我们还是更希望关注在怎么能给用户真正价值上,而不是过多去关注竞争本身,因为竞争本身并不产生价值。怎么提升模型的思考推理能力,这是我们现在最核心的问题。通过这个东西给用户带来更大的价值,就是做正确的事情,而不专门去做不一样的事情。我觉得只要能有人实现 AGI,它都是非常好的结果。Q:什么时候决定只做 Kimi 这一个产品?杨植麟:大概今年二、三月份吧,或者三四月份,大概那个区间。一个是基于美国市场的判断,二是基于我们自己的观察,主要是这两点,确实得做减法,不是疯狂的做加法。Q:为什么?杨植麟:这两年,我们主动的选择做了业务的减法。我觉得这个还是很重要的,也是我们过去一年比较大的 lesson(教训)。我们一开始确实也尝试过比如说几个产品一块做,这个在一定的时期内有可能是有效的,到后来发现还是要聚焦,把它做到极致,是最重要的。砍业务本质上也是在控制人数。这几个大模型创业公司里,我们始终保持人数最少,始终保持卡和人的比例最高,我觉得这个是非常关键的。我们不希望把团队扩那么大,扩那么大,对创新的影响是有致命性的伤害的。三个业务一起做,我就活生生把自己变成大厂,我就没有任何优势。Q:现在,你们最核心的任务是什么?杨植麟:最核心的任务就是提升留存,或者把留存作为一个重要的衡量指标。我觉得,用户留存,和模型的成熟度、技术水平,也是一个正相关的过程。包括思考能力还不够强,交互不够丰富,所以它今天能做的交互还比较有限。无论是跟用户的交互,还是跟本身客观世界的交互,还有很大的提升空间。如果我们衡量离 AGI 目标的距离,我觉得现在还是初级阶段。当然,每年都有比较大的进步,如果我们用去年的产品,你会发现可能根本没法忍受。Q:现在怎么考虑出海问题?杨植麟:我觉得先聚焦,然后全球化,需要更耐心一点。Q:最近大家都在谈大模型的投流问题,你们怎么实现良性的商业化?杨植麟:我觉得肯定有,但是对我们来说现在最关键的还是留存,我觉得这个还是需要看的再长远一点,至少 ROI 需要为正吧,这跟技术的进展是高度正相关的。对我们来讲最核心的是把留存和 Organic growth(自然增长)做好。适当的投放是需要的,但是你需要平衡好这几个东西之间的关系。koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:吕文达
TOP1热点:律师解读女子抱娃跨进兵马俑坑道
从宏观上看,随着工业化、城市化进程推进,最终消费率存在一个从高到低、再从低到高并趋于相对稳定的“慢U型”曲线变化过程。发达国家最终消费率在进入中高收入阶段后基本稳定在50%至70%之间。相应地,随着经济发展水平提高,投资趋于饱和,消费对经济增长的贡献逐渐提高,发达国家的消费贡献率在进入中高收入阶段后普遍保持在60%至80%之间。。
TOP2热点:18省区市将有大到暴雨
打好自我革命攻坚战、持久战。党的十八大以来,我们党开展了史无前例的反腐败斗争,坚持无禁区、全覆盖、零容忍,“打虎”“拍蝇”“猎狐”多管齐下,不敢腐、不能腐、不想腐一体推进。坚决查处政治问题和经济问题交织的腐败案件,坚决清除不收敛不收手的腐败分子,消除了党、国家、军队内部存在的严重隐患,成功走出一条依靠制度优势、法治优势反腐败之路,谱写了反腐败斗争新篇章。
进入21世纪以来,科学技术的快速发展带来了新一轮的科技革命和产业变革,创新能力成为决定国家当下竞争力、影响未来增长潜力的重要因素,如何提升创新能力引发了世界各国的关注。
TOP3热点:“两弹一星”元勋周光召逝世成品78w78隐藏通道1
“在一些地方,无障碍设施‘重建设轻维护’‘重建设轻管理’,保障措施不充分,监督管理力度不足。”石宏介绍,针对这些问题,法律进一步明确所有权人、管理人的维护管理职责,并设“保障措施”“监督管理”两个专章。
TOP4热点:俄库尔斯克核电站城市上空传出爆炸声14may18_XXXXXL56endian40
“政校企三方合作是促进校地、校企对接的有力手段,也是促成政校企三方在产教融合、人才培养、产学研一体化发展等方面加强合作的基础。”合肥高新区党工委副书记陆平表示。
TOP5热点:小区门口开殡葬店遭业主抵制一本大道色卡1卡2卡3
今年以来,针对小微企业和个体工商户的税收优惠政策持续起效。国家税务总局政策法规司司长戴诗友8月1日在国家发展改革委举行的专题新闻发布会上介绍,据统计,今年上半年,包括小微企业和个体工商户在内的民营经济纳税人缴费人新增减税降费及退税缓费7049亿元,占比76%,是政策惠及的主体。
正值暑期,全国多地气温持续攀升,避暑游成为暑期旅游热门选择。吉林省利用生态、气候等资源优势,在省内多地打造消夏避暑消费新场景,擦亮“清爽吉林・22℃的夏天”旅游品牌,让游客同享夏日清凉与精彩。
TOP6热点:巴黎残奥会赛程表MAY18_XXXXXL56
正值暑期,全国多地气温持续攀升,避暑游成为暑期旅游热门选择。吉林省利用生态、气候等资源优势,在省内多地打造消夏避暑消费新场景,擦亮“清爽吉林・22℃的夏天”旅游品牌,让游客同享夏日清凉与精彩。
进入21世纪以来,科学技术的快速发展带来了新一轮的科技革命和产业变革,创新能力成为决定国家当下竞争力、影响未来增长潜力的重要因素,如何提升创新能力引发了世界各国的关注。
TOP7热点:派出所原所长举报官商勾结 纪委介入16may20_XXXXXL56endian
从市场结构上看,摩根士丹利基金主动权益投资团队对《证券日报》记者称,今年市场结构或更偏成长与消费风格。“我们将重点关注现代化产业体系下的高端制造、信息技术以及估值优势明显的医药、消费行业。”
在2日进行的第十四届全国冬季运动会男子冰球比赛中,北京队以12:1战胜陕西队,取得四连胜。
TOP8热点:徐嘉余谈退役暴躁老阿姨CSGO技巧
(作者为本报评论部编辑)
大气反演法是一种测量碳汇的方法,是基于大气CO_2浓度观测数据与大气传输模型,结合人为源CO_2排放清单,评估陆地碳汇的重要手段。
TOP9热点:向佐《披荆斩棘4》意外淘汰是剧本吗欲成欢第三部
群众的实践是最丰富最生动的实践,群众中蕴藏着巨大的智慧和力量。今天,14亿多中国人民正在进行着“人类历史上最为宏大而独特的实践创新”,为马克思主义理论创新提供了不竭源泉。新征程上,继续推进党的理论创新必须走好群众路线,决不能闭门造车、坐而论道、流于空想。习近平总书记强调:“在人民面前,我们永远是小学生,必须自觉拜人民为师,向能者求教,向智者问策;必须充分尊重人民所表达的意愿、所创造的经验、所拥有的权利、所发挥的作用。”坚持人民至上,是推进马克思主义中国化时代化的根本出发点。我们要尊重人民首创精神,注重从人民的创造性实践中总结新鲜经验,上升为理性认识,提炼出新的理论成果,着力让党的创新理论深入亿万人民心中,成为接地气、聚民智、顺民意、得民心的理论。
正值暑期,全国多地气温持续攀升,避暑游成为暑期旅游热门选择。吉林省利用生态、气候等资源优势,在省内多地打造消夏避暑消费新场景,擦亮“清爽吉林・22℃的夏天”旅游品牌,让游客同享夏日清凉与精彩。
TOP10热点:山西一景区游客与保安起冲突遭围殴老公看我和别人发的关系
重庆市政协副主席丁时勇认为,在当前新产业革命背景下,市场需求将更加个性化与多样化,产业转型升级的主要路径是从低附加值向高附加值升级,从高能耗高污染向低能耗低污染升级,从粗放型向集约型升级。