16-12HDXⅩXX4KHD_财经新动_DeepSeek16-12HDXⅩXX4KHD,为何出自量化基金公司?

16-12HDXⅩXX4KHDDeepSeek16-12HDXⅩXX4KHD,为何出自量化基金公司?

16-12HDXⅩXX4KHDDeepSeek16-12HDXⅩXX4KHD,为何出自量化基金公司?

DeepSeek16-12HDXⅩXX4KHD,为何出自量化基金公司?

而就在近日,彭斯曾高调访问乌克兰,展现自己对乌克兰的支持。但在7月1日的发布会上,泽连斯基说了这么一句非常有意思的话:他支持乌克兰,首先是以一个美国人的身份,其次才是以一个共和党人的身份。

本文来源:时代周报 作者:郭儒逸春节假期,泼天流量降到了DeepSeek的头上。大概一周多之前,DeepSeek还算不上太有名气,在大模型圈之外,外界对它可能多是一头雾水。然而短短几天,其就一跃成为业界顶流,并闯进了公众视野。因接连推出的两款大模型产品,DeepSeek在华尔街掀起风暴,美股科技股一度重挫。周二,英伟达单日蒸发近6000亿美元市值,博通和美光科技等芯片产业链股票也纷纷大跌。虽然周三英伟达反弹涨近9%,但DeepSeek带来的心理冲击并没消散。“DeepSeek大模型在性能上比肩ChatGpt,可能意味着国产大模型实现突破,这对美股科技股造成了冲击。”前海开源基金首席经济学家杨德龙告诉时代周报记者。在他看来,科技股是美股牛市的主要推动力,但投资者担心其估值产生巨大泡沫。若一些新技术突破或新模型不需要消耗那么多的GPU,可能会引发像英伟达等公司的大幅下跌,从而导致美股科技股泡沫破裂。作为一家成立不到两年的大模型公司,无论在融资、技术进展还是舆论层面,DeepSeek一向都动静不大。而它背后的公司幻方量化(一家头部量化私募),在此之前也仅是在私募圈出名。出人意料的是,一家私募和一家大模型初创公司,这样的少见组合诞生了“DeepSeek神话”——无疑令人倍感好奇。这一切是怎么做到的?潜行多年如果从成立时间上看,DeepSeek并无特别之处。自2022年底ChatGPT发布之后,全球科技圈震动,随之一系列国产大模型创业项目面世。DeepSeek搭乘的也是这股潮流,2023年4月,幻方量化高调宣布进军大模型,三个月之后,DeepSeek作为独立公司成立。但脱胎于幻方量化的DeepSeek,其实技术积累要更早。幻方量化成立于2015年,创始人是梁文锋。在该公司官网上,赫然写着的是:使用AI投资的对冲基金。按照幻方量化的披露,在公司成立之前七八年时间,创始团队就在探索将技术应用于投资交易。当时量化投资在国内尚未流行,团队成员在这方面的经验同样寥寥,出于朦胧的市场感知和技术理想,梁文锋团队仍决定走上这条路。在这一时期,幻方量化创始团队从零开始尝试全自动交易,采用机器学习等技术。2010年是一个转折点,当年股指期货和融资融券相继推出,A股投资更活跃和多样化。一时间,量化投资在国内私募基金业逐渐增加,报道称梁文锋团队也借此收益颇丰。2015年,幻方量化正式成立,借助AI和数学进行量化投资。2016年,幻方量化第一个由深度学习算法模型生成的股票仓位上线实盘交易,使用GPU进行计算。而在此之前,算法主要依靠线性模型和传统机器学习算法,模型计算主要依赖于CPU。自此之后,幻方的量化策略全面AI化。到2017年底,几乎所有量化策略均已采用AI模型计算。随后不久,该公司明确宣布AI为主要发展方向。所谓量化投资,指的是借助统计学和数学方法,利用计算机程序对大量数据进行分析,寻求获得超额收益的投资策略。在持仓风格上,量化投资倾向高度分散和多样化配置,以降低单一资产波动的风险。在决策上,不同于传统的依靠基金经理主观判断,量化公司是基于数据和模型进行交易。全面AI化也带来某些问题,比如复杂的模型计算需求使得单机训练遭遇算力瓶颈,训练需求和有限的计算资源产生矛盾,幻方量化需要解决大规模算力的受限难题。在这个背景下,幻方量化在2019年成立了一家AI基础研究公司,并推出自研的“萤火一号”AI集群,搭载500块显卡。同一年,幻方量化规模扩张,跻身百亿私募。2021年,幻方又斥资10亿元加码建设“萤火二号”,为AI研究提供算力支持。从事后来看,幻方量化在构建AI算力过程中的“囤卡”动作,为它赢得了市场机会。作为国内早期的英伟达芯片大买家之一,在ChatGPT爆发前夜,幻方量化手中的英伟达显卡数量就越攒越多。据幻方量化称,在2022年时,其用于科研支持的闲时算力高达1533万GPU时,这意味着每天用于科研而非交易的算力便达4.2万GPU时。这个水平,大大超越了后来的很多大模型公司。DeepSeek,就是在这样的加持下问世。也交过学费幻方量化上演了一个“一朝成名天下知”的精彩故事,在它的叙事版本里,无论做金融交易还是进军大模型,都是比较纯粹的技术向追求。一位接近幻方量化的投资人士告诉时代周报记者,他一直很关注这家公司,并且和团队成员有过交流。虽然没有直接接触过创始人本人,但能感觉出来,相对于商业盈利,这个团队的技术理想色彩是更为浓厚的。幻方量化希望通过AI量化交易,对金融资产进行定价和投资。金融交易足够复杂,又是从起家就介入的领域,对于旨在实现通用人工智能(AGI)的幻方量化而言,这是一个非常合适的切入场景。早在2020年,点拾投资创始人朱昂曾访谈过幻方量化CEO陆政哲。彼时陆政哲称,幻方量化将自己定义为一家完全依靠AI来做投资的对冲基金。其模型数据来源有三个,分别是行情数据、覆盖全市场的基本面数据以及经过结构化处理的另类数据。用这三类数据来训练机器模型,据此构建投资组合,再用精细化的程序化交易完成交易。这套打法确实效果显著,在2017年-2020年间,整个量化行业高速增长,幻方量化的管理规模也水涨船高。不过,量化交易并非完美,幻方量化在这上面也吃过苦头。2021年12月,由于业绩回撤达历史最大值,幻方量化就业绩不及格发文致歉。幻方量化称,其人工反复检视了AI的投资决策,认为AI选出来的股票从长期价值来说基本上没问题,但在买卖时点上确实做的不够好。尤其市场风格剧烈切换时,AI倾向于冒险博取更多收益,这进一步加大了回撤。量化资管行业扩张太快,被认为是另一个原因。幻方量化认为,行业规模猛增,导致策略同质化严重,加大了整体操作的难度。因此,当时幻方量化着手控制总的规模,同时表态要加大对策略研究的投入,以重新获得市场优势。而在监管层面,2024年7月份融券业务相关政策发生重大调整,转融券业务暂停,并且融券保证金比例上调。此外,程序化交易被进一步强化监管。量化行业似乎告别一段野蛮发展期。目前,梁文锋旗下有两家百亿私募,除了宁波幻方量化(股票策略),另外一家是浙江九章资产(多资产策略)。就业绩而言,据私募排排网数据,过去两年量化公司的风头仍然强势,如2023年百亿私募排行榜中,前十名中量化公司占据六席,在104家上榜私募中,九章资产和幻方量化的业绩分列32和33位。到2024年,量化私募的整体收益仍高于主观私募,除东方港湾(主观投资)牢牢把持行业首位之外,前三十名中量化或主观+量化的机构占据多数。不过,幻方量化的业绩同样算不上突出,仅排在第19位。在私募排排网有业绩展示的12只产品中,幻方量化旗下产品2024年的收益均值为12.18%,收益中位数为13.02%。“还需冷静看待”某种程度上,DeepSeek应该是幻方量化的深度转型之作。成立之初,该公司就表示将专注在大模型上,从语言大模型到视觉大模型,再到多模态大模型,堪称步步为营。过去一年多,从默默无闻到火爆出圈,DeepSeek经历了一条清晰的产品迭代之路。在2024年5月之前,DeepSeek相继推出了DeepSeek Coder(免费且开源的首个模型)、DeepSeek LLM(第一个大语言模型),其中DeepSeek LLM包含670亿参数,在一个包含2万亿token(语言模型中用来表示单词或短语的符号)的数据集上进行训练。在中文表现上,该模型据称超越了当时的GPT-3.5。这两款模型都没有引起波澜,直到随后发布的DeepSeek-V2,才让DeepSeek在圈中出名。DeepSeek-V2是混合专家(MoE)语言模型,包含总参数达到2360亿,每个token激活210亿个参数。在一些行业测试中,DeepSeek-V2有着不错的表现。有意思的是,当时国内业界对这款模型似乎欠缺技术层面的关注。DeepSeek-V2之所以被注意到,是由于它在大模型行业掀起一场价格大战——DeepSeek在5月出宣布,DeepSeek-V2降价至每百万Tokens输入价格为1元、输出价格为2元,开发者还能获得500万Tokens的免费额度。这个价格水平,大约相当于GPT-4 Turbo的七十分之一。随即互联网大厂纷纷跟进,甚至不乏有厂家将价格降得比DeepSeek-V2还低。就在国内玩家为价格战打的火热时,有硅谷从业者发现,DeepSeek-V2采用的多头潜在注意力机制,有效提升了大模型的性能。这或许是硅谷较早地正视这家中国初创公司。据一位行业相关人士解释,多头潜在注意力机制是DeepSeek-V2提出的一种注意力架构,该架构可以显著降低推理过程中的KV缓存。所谓KV缓存,指的是在大模型的推理过程中,用于存储先前计算结果的一种技术。到2024年底,DeepSeek继续迭代,推出了DeepSeek-V3模型。DeepSeek终于迎来它的GPT-3时刻。今年1月20日,DeepSeek-R1发布,在数学、代码、自然语言推理等任务上,宣称性能对标OpenAI o1正式版。而它的蒸馏(将大模型的知识迁移到小模型中)小模型,也超越了OpenAI o1-mini。此外,在开源和闭源路线仍有争议的眼下,DeepSeek宣布R1开源,允许用户进行“模型蒸馏”,以促进技术共享。DeepSeek-R1是一枚重磅炸弹,在性能上为全球业界瞩目之外,更重要的是——它的成本相比竞品大大降低。一周之后,DeepSeek趁热打铁,又推出开源多模态模型,被认为在文生图方面超越OpenAI的DALL-E3。至此,外界对DeepSeek的讨论关注,达到高潮。与先进大模型保持相近的性能,并在训练成本、运行成本和服务定价上全面大幅下降,这是DeepSeek震撼科技圈的原因。在这样的现象级产品出现之前,过去两年多时间,由于AI业界对高性能显卡的追逐,英伟达被一路推上王座。无论在资本市场还是产业链,这个逻辑似乎已经确立,没料到DeepSeek横空出世,硬生生搅了局。不过,这场冲击波能持续多久,还是个未知数。DeepSeek的势头固然很猛,但是否弥合了国产大模型与国际先进水平之前的技术代差,正在引发热议。另外,DeepSeek通过算法优化提升效率,是否就意味着对算力需求的明显减弱,下结论也太早。喧闹之外,降温观察逐渐成为一种声音。“针对最近几天事情的发展,个人觉得还是冷静看待,肯定其取得的成就,但也要避免情绪化。”上述投资人士如此说道。

koa12jJid0DL9adK+CJ1DK2K393LKASDad

编辑:李大江

TOP1热点:人民日报头版头条:2025年,全方位扩大国内需求

悲痛的家属/网图。

而就在近日,彭斯曾高调访问乌克兰,展现自己对乌克兰的支持。但在7月1日的发布会上,泽连斯基说了这么一句非常有意思的话:他支持乌克兰,首先是以一个美国人的身份,其次才是以一个共和党人的身份。

TOP2热点:哪吒2或登顶中国影史票房冠军,媒体:体现好电影的评判标尺

而村子里的土地在池塘的另一个方向,离事发的池塘非常远,根本听不见池塘这边传来的动静,更不可能看到这边的情况。

7月4日早上,失联女子的前夫彭先生告诉记者,和前妻刘女士一起失联的,还有一名来自山西的男子。尽管他们自驾的车辆于7月3日在河中找到了,但目前仍未拖上来,里面的淤泥也没清理完,不知道人是否在里面。目前,刘女士的家人也在当地,等待救援消息。

TOP3热点:特朗普称将“接管”加沙,专家:哈马斯和邻国都不会同意男男伦流澡~你tm别㖭了

黄毅的第一个问题是,“理想信念丧失,政治意识淡漠,

刘女士图据网络

TOP4热点:本命年女子称穿红色内裤发现掉色并过敏,胖东来致歉承认管理存在问题男生把坤放女生定眼会怎样

虽然荷兰政府未直接点名并宣称“国家中立”,但此举普遍认为是为限制全球芯片光刻技术的领军企业——荷兰阿斯麦(ASML)公司向中国出口制造高端芯片必不可少的先进光刻机。英国《金融时报》就直指,中国公司预计将是少数被拒绝许可的公司之一。

玩忽职守罪(非司法工作人员玩忽职守侵犯公民权利、损害司法公正的情形除外);

TOP5热点:马英九千字长文悼念辜严倬云:两岸和平是“辜妈妈”的心愿坐在学霸的棍子上背单词

暴力取证罪;

而村子里的土地在池塘的另一个方向,离事发的池塘非常远,根本听不见池塘这边传来的动静,更不可能看到这边的情况。

TOP6热点:美方宣布对华加征关税后特朗普称不急于同中方领导人通话,外交部回应舔舐花蜜

国民党智库的民调,也证明侯友宜确实沦为第三名,且在国民党支持者当中只有七成左右的支持率,这使国民党上下陷入紧张之中。侯友宜去国民党中常会参加便当会,工作人员采购的就是店名叫“老三的便当”,恰好暗合侯友宜民调第三,意外激起一波笑谈。不过,国民党党团总召曾铭宗则因此动怒,认为这个笑话一点不好笑,曾铭宗是初选提名时候最挺侯友宜的民代之一,现在搞成这个局面,确实乐不起来。

另外,他还被指违规出入私人会所;贪欲膨胀,通过民间借贷获取大额回报,违规从事营利活动;利用职务便利为他人在人事安排、工程承揽、项目审批等方面谋利,并非法收受巨额财物等。

TOP7热点:DeepSeek“朋友圈”不断扩围:10家国内外云厂商宣布接入,供用户按需部署男生女生修修修轮滑鞋免费

因为出事地点是在池塘里,所以王友仁和林江国都来葬礼上祭拜了刘大娘。

秦光荣担任云南省委书记的省委班子中,还有仇和(曾任云南省委副书记)、张田欣(曾任云南省委常委、昆明市委书记)、曹建方(曾任云南省委常委、省委秘书长)等人。

TOP8热点:小米SU7服务区被恶意割胎,警方通报:60岁嫌疑人已被刑拘生物繁殖课老师拿自己当例子

见这群人这么蛮不讲理,一旁看热闹的人都忍不住嗤笑着开口了。

根据阿斯麦2022年财报,该公司去年共出货345台光刻机,其中42%销往中国台湾,29%销往韩国,14%销往中国大陆,7%销往美国,上述国家与地区均为全球主要芯片供应商所在地。

TOP9热点:特朗普称希望美国接管加沙,内塔尼亚胡:你总说出别人不愿说的话x7x7x7x7x7任意槽2023

编辑丨刘莹,深圳卫视直新闻主编

王友仁在池塘边安装护栏/网络示意图

TOP10热点:泰国正式对泰缅边境的缅甸地区断网、断电和断油年轻善良的㥰子

贝莱德

张军称,两天后,万某安排了一个姓肖的女子,将张颖从监视居住的宾馆带出,父女俩见了40分钟,之后张颖被肖某带回宾馆。“当天晚上,他把我带到一处隐蔽的地方,说要尽快打点关系,不然移交检察院就麻烦了。他提出只要现金,并每次谈钱,都让我关掉手机,有时候还会搜身。”

发布于:韶山市