刺激鲁只招1%的天才刺激鲁,这家中国公司让硅谷难安
只招1%的天才刺激鲁,这家中国公司让硅谷难安
当然,日本方面如果老老实实的,那情况又两说了。毕竟,我们需要的是和平与繁荣,而不是动辄打打杀杀。对自卫队来说,退回到专属防卫的位置,才最安全!
本文来自:凤凰网科技,作者:Danny、董雨晴OpenAI的最强对手出现了,这一次来自中国。2025年一开年就火遍全球的DeepSeek(深度求索),1月20日晚上演了一场“偷袭珍珠港”——发布推理模型 DeepSeek-R1 正式版,同步开源模型权重,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。这款大模型在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。R1版本的推出,在海外被惊呼“这才是真正的开放的人工智能”。英伟达高级研究科学家Jim Fan在评价R1模型时就这样说道:“我们生活在这样一个时代:一个不是美国公司的AI企业却实现了 OpenAI成立时的使命——做真正开放的前沿研究、为所有人赋能。”凤凰网科技在此前的文章《英伟达的最大空头出现了》中曾详细介绍过深度求索(DeepSeek)和其系列大模型的核心竞争力来源,如今看来,DeepSeek的创新含金量还在上升。随着DeepSeek的创新实力成为全球热议议题,外界也愈发关注,这家中国本土科技公司及其背后的掌舵人,究竟有何特别之处?一个浙大学霸,勇闯无人区1985年,梁文锋出生于广东湛江的一个五线城市。其具体的童年成长轨迹已不可考,从公开信息唯一可知的是,梁文锋有在采访中提到过自己的父亲是一名小学老师。2002年,17岁的梁文锋凭借优异成绩考入浙江大学电子信息工程专业。2007年,22岁的梁文锋又考上了浙江大学信息与通信工程专业硕士。师从项志宇,主要做机器视觉研究。2008年,23岁的梁文锋在浙江大学攻读硕士学位期间,与同学组建团队,开始收集市场行情、金融市场相关数据以及宏观经济数据。这一年,他带领团队运用机器学习技术探索全自动量化交易,而当时正值全球金融危机的爆发。有消息称,大疆创始人汪滔曾邀请梁文锋共同创业,彼时大疆正处于起步阶段。如果梁文锋加入,或许也能在大疆的发展中实现财富自由。但梁文锋坚信人工智能将改变世界,最终决定独立创业。2010年6月,25岁的梁文锋从浙江大学信息与通信工程专业硕士毕业,其毕业论文题目为《基于低成本PTZ摄像机的目标跟踪算法研究》。硕士毕业后的第三年,28岁的梁文锋将人工智能与量化交易结合,和浙江大学的徐进校友创立了雅克比投资(杭州雅克比投资管理有限公司)。2015年,他们共同创立杭州幻方科技有限公司,也就是今天的浙江九章资产管理有限公司,次年又成立了宁波幻方量化投资管理合伙企业(有限合伙)。所谓量化投资,通俗地说就是用计算机取代人,通过数量化方式,程序化发出买卖指令,投资收益较为稳定。经过几年时间,幻方量化就在国内迅速崛起。2016年10月,幻方量化推出第一个AI模型,第一份由深度学习生成的交易仓位上线执行。到2017年底,几乎所有的量化策略都采用AI模型计算。2019年,幻方量化管理规模突破百亿,成为国内量化私募“四巨头”之一。此后的幻方量化甚至一度成为中国首家突破千亿的私募量化大厂,准确地说也是迄今为止业内唯一规模曾迈过千亿大关的量化私募。这期间梁文锋在量化投资领域积累了强大的技术实力和算力资源,幻方量化以强大的算力支持闻名。2023年,全球人工智能热潮爆发,梁文锋也来到了他创业之路的第十个年头。当年5月,38岁的梁文锋宣布要做通用人工智能(AGI)。7月,杭州深度求索人工智能基础技术研究有限公司(DeepSeek)成立,专注于AI大模型的研究与开发。梁文锋也成为量化投资者投身AI创业的“第一人”。之后便是爽文剧本式的“AI界拼多多”崛起之路,就连大厂也只能是跟随,“在豆包和阿里云之前,DeepSeek最先在全网降低了模型成本”,一位AI算法工程师对凤凰网科技表示,这让他印象非常深刻。2024年5月,DeepSeek发布的DeepSeek V2的开源模型率先拉起了行业内的价格战。DeepSeek V2提供了一种史无前例的性价比:推理成本被降到每百万token仅1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。同年12月26日,仅仅时隔7个月,DeepSeek就又发布了DeepSeek V3,再次颠覆了行业对于价格的认知。DeepSeek V3的API定价为输入每百万tokens 0.5元(缓存命中)/2元(缓存未命中),输出每百万tokens 8元,与字节Doubao-pro-256k定价输入每百万tokens 5元,输出每百万tokens 9元的水平相当,在国产模型中性价比继续提升。如今,当行业还沉浸在DeepSeek V3的震撼中时,DeepSeek-R1正式版又来了。这一次,DeepSeek真正引发了硅谷的恐慌。微软CEO萨蒂亚・纳德拉在瑞士达沃斯世界经济论坛上表示:“看到DeepSeek的新模型,真的令人印象非常深刻。他们切实有效地开发出了一款开源模型,在推理计算方面表现出色,且超级计算效率极高。”“我们必须非常、非常认真地对待中国的这些进展,”纳德拉说。DeepSeek的宝贵之处,仍是创新“DeepSeek的确有过人之处,业内都觉得他们可能是用了一些o1的数据做蒸馏,但在算法层面做了更好的创新”,一位行业从业人士认为。在刚刚成立的一年多时间里,DeepSeek一直不声不响,据凤凰网科技了解,这家公司甚至没有设立公关团队。以至于,当多数大模型公司都在争声量,抢时间的时候,DeepSeek在闷声尝试创新。DeepSeek的创新也是自下而上,几乎存在于整个公司内部。比如,时至今日,梁文锋的日常依旧是看论文、写代码、参与小组讨论。是少有的能堪比一线研究员能力的公司掌舵者。由于一开始的目标就是AGI,所以DeepSeek从来不做跟随策略,即像其他商业类公司一样,选择追随全球最先进的模型,用短平快的方式做好应用,而是在模型结构层面做从0-1的创新。在接受《暗涌》采访时,梁文锋也曾明确地表达,“因为我们觉得现在最重要的是参与到全球创新的浪潮里去。过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现,但这并非是一种理所当然。这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展”。过去,碍于人才构成和资本实力,中国企业做的往往是有限的创新,但现如今,强如字节等企业,已经有数百亿美元规模的年度利润。据凤凰网科技此前获悉,字节豆包大模型团队已在内部组建AGI长期研究团队,代号“Seed Edge”。这意味着,创新已不再是难题,难的是如何保持人才密度,以及拥有自信。据多位与DeepSeek有过接触的行业人士表述,DeepSeek的优势之处就在于人才密度极高,且多来自于中国本土市场。“DeepSeek从一开始团队就是百人左右规模,但个个都很抗打”,一位AI行业猎头对凤凰网科技表示,“其实早期Kimi也曾想走这个路线,只是没有特别成功。”另一位与DeepSeek有过接触的行业人士称,“DeepSeek给出的薪酬待遇非常具有竞争力,这让其一直对人才有很强的吸引力”。此前据多家媒体报道,雷军曾亲自出手“挖deepseek的人”,支付的薪酬则在千万元级别。这个人正是DeepSeek-V2的关键开发者之一罗福莉,一个95后。据量子位整理资料发现,DeepSeek团队最大的特点就是年轻。应届生、在读生,特别是来自清北的应届生在其中非常活跃。“只招1%的天才,去做99%中国公司做不到的事情。”面试过DeepSeek的应届生这样评价其招聘风格。这也使得DeepSeek全员上下,都保持着极致的创新动力。梁文峰在接受《暗涌》采访时同样表达过一个观点:DeepSeek在招人时主要看能力,而不是看经验。“我们的核心技术岗位,基本以应届和毕业一两年的人为主”。并且梁文锋还表达,“V2模型没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人。”和上一代功成名就的故事不同,DeepSeek代表的是一个硬核创新时代的到来。上一代的成功人士是属于互联网的,他们在技术层面的突破并不多,更多是拼速度、拼资本、拼规模。一个可喜的信号是,DeepSeek不是孤例,同样来自杭州本土市场,宇树科技最新推出的机器人B2-W同样惊艳全球,宇树科技的创始人兼CEO王兴兴,本科就读于浙江理工大学机械与自动控制学院机电专业,本科毕业后进入上海大学攻读机械工程专业研究生。我们也有理由相信,中国科技创新的故事已经翻入了新一页。参考资料1. 揭秘DeepSeek:一个更极致的中国技术理想主义故事,暗涌Waves,作者:于丽丽2.全网都在扒的DeepSeek团队,是清北应届生撑起一片天,量子位3.DeepSeek创始人梁文锋,广东人,仅靠百名中国程序员,赶超OpenAI,CEO来信本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.comkoa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:冯兴国
TOP1热点:印度雪崩营救行动结束 8人死亡
会议强调,要清醒认识做好隐患排查的极端重要性,深入开展安全风险专项整治。要对前期全省已排查清理的危楼,按照预案加强管理,并迅速组织排查各类学校、公益体育场馆建筑安全。。
TOP2热点:前2个月全国电动自行车换新超百万辆
此外,江苏法德东恒律师事务所高级合伙人蓝天彬律师表示,认定高空抛物是一个民事纠纷,还是行政责任或刑事责任,没有一个明确的界限,要综合行为、造成的后果以及危险性来评判。他还表示,对于一些没有找到肇事者的高空抛物事故,可能需要整栋楼的居民来共同担责。同时,物业也对高空抛物具有提醒、排查的义务,如果没有尽到安全保障义务,或也要承担相应的责任。
TOP3热点:欧洲议会官员:中欧有许多共同利益део 38
27年前,大儿子两岁时,王女士的丈夫出车祸去世。第二任丈夫婚内出轨且不愿意抚养小儿子,离婚后又因贩卖毒品入狱。“爷爷奶奶、外公外婆都不在了,我一个人不离不弃把他俩养大。”王女士说。
TOP4热点:回南天走了冰雹来了MACBOOKPRO高清
什么样的选择,才值得被历史和时间铭记?
“现场停放了救护车等多台救援车辆。”事发当日,事发地附近一商户向南都记者讲述。据现场视频,多台消防车、救护车等应急车辆及挖机、吊机等设备停放在涉事体育馆前的草坪上,跑道上有积水。
TOP5热点:多地解锁春日特色消费场景2023AMAZON欧洲站
大儿子为了赚钱给她做手术被骗,小儿子则是为了救哥哥被骗。知道小儿子的消息后,王女士的天都塌了。向公安机关报警、找大使馆求助、寻求各种关系牵线搭桥,王女士用尽全力,只想救儿子。
TOP6热点:张雨霏想穿汉服在明城墙上拍写真campbuddy大基基的长度
就在7月3日,2023年中日韩合作国际论坛在青岛举行。
TOP7热点:山航飞机暴雪中硬核起降国精产品999一区二区三区有限
之所以能坚持半个世纪之久,更在于习近平主席所说的第二个“不会忘记”——不会忘记你为推动中美关系发展、增进中美两国人民友谊作出的历史性贡献。
专家认为,未来尹锡悦政府的政策路线不会出现大的改变。王箫轲更向南都记者指出,长此以往,尹锡悦政府执政最大的危机就是要面对不断加剧的经济下行风险。
TOP8热点:冯远征谈真人电影票房不如《哪吒2》女生会把隐私透露给异性朋友
盖洛普分析称,“总统职务评价数据实际上与上周没有变化,肯定评价的理由也一样”,“否定评价者选择的理由中,灾难、民生应对相关内容出现,福岛放流比重减少”。
当地时间21日凌晨,俄军连续第三晚对乌克兰黑海港口城市敖德萨发起“地毯式”空袭,空袭造成敖德萨及邻近地区的基础设施严重受损。当地居民表示,“敖德萨港已经不复存在,只剩下了一堆混凝土……”
TOP9热点:广东汕头海域现海市蜃楼?不实国精一二二产品无人区
7月23日14时56分,齐齐哈尔市消防救援支队指挥中心接到报警,齐齐哈尔市第三十四中学体育馆发生坍塌。据了解,事故发生时,馆内共有19人,其中4人自行脱险,15人被困。
TOP10热点:男子上班3天被辞退 7天后公司没了中国windows野外
“综合各方面的考虑,面对这种情况,他自己有点‘高不成低不就’,还是不甘心。”针对放弃第二次补录机会,何汉立向记者透露,目前本科第一批已到了第二次征集志愿阶段,真正选择的专业和学校范围比较狭窄,唐尚珺认为如果以这样的结果草草收场,与预期想法差距太大。