黑料网-独家猛料-曝光英伟达市值蒸发近6000亿黑料网-独家猛料-曝光美元,而DeepSeek刚刚又开源新模型
英伟达市值蒸发近6000亿黑料网-独家猛料-曝光美元,而DeepSeek刚刚又开源新模型
企查查显示,黑龙江嘉美建设有限公司成立于2009年7月,注册资本5000万元,实缴资本100万元,法定代表人为程某某,经营范围包含建设工程施工、住宅室内装饰装修等。招投标信息显示,该公司曾中标多个学校工程项目。
机器之心报道编辑:亚鹂、Panda龙年即将结束,但有些股民可能无心过春节了。受低成本推理模型 DeepSeek-R1 热潮影响,美股昨日开盘后迎来重挫。周一,英伟达市值大幅下跌,损失接近 6000 亿美元,创下美国历史上公司单日市值最大跌幅。此次股价暴跌幅度达 17%,最终收盘价为 118.58 美元。上周,英伟达才刚刚超越苹果,成为全球市值最高的上市公司。此次股价暴跌直接导致纳斯达克指数下滑了 3.1%。另一家依赖 AI 获得巨额市值增长的美国大型芯片制造商 Broadcom,周一跌幅则达到 17%,市值蒸发了 2000 亿美元。此次抛售的原因,主要是源于中国人工智能实验室 DeepSeek 带来的全球 AI 竞争压力飙增的担忧。去年 12 月,DeepSeek 发布了一个免费的开源大语言模型 ——DeepSeek-V3,训练成本仅仅为 558 万美元,并表示该模型只用了两个月时间完成,使用的还是英伟达的低能力版芯片 H800。反观 Alphabet、Meta 和亚马逊等科技巨头,为训练和运行 AI 模型,花费了数十亿美元用于购买英伟达最前沿基础设备。将开源进行到底,Janus-Pro 问世在美股一片惨嗥的同时,DeepSeek 再接再厉继续开源,发布了视觉模型 Janus-Pro。该模型是去年 10 月发布的 Janus 的升级版,在质量上实现了飞跃式提升。与此同时,DeepSeek 还发布了一款多模态理解模型 JanusFlow-1.3B。Janus-ProJanus Pro 是基于之前的 Janus 开发的高级版。整体而言,Janus Pro 实现了三大改进:训练策略优化、训练数据扩展、扩展到了更大模型。有了这些改进, Janus Pro 在多模态理解和文生图指令遵从能力都收获了显著提升 —— 在多个基准上超越了 DALL-E 3 与 Stable Diffusion,同时文生图的稳定性也得到了加强。此次,DeepSeek 一次性发布了 7B 和 1B 两个版本。刚刚注册 帐号的 DeepSeek 创始人梁文峰(目前还无法验证该帐号的真实性)也宣布了此消息。已经有不少网友尝试过该模型了,比如生成一个看起来像网球的小鸟,绒毛形态十分逼真。或者由「美丽的汉字」五个字符组成的图画:这个同时兼具视觉理解和生成的模型着实再一次震惊了中外 AI 社区,毕竟这个表现如此卓越的模型仅有 7B 大小!论文标题:Janus-Pro: Unified Multimodal Understanding and Generation with Data and Model Scaling论文地址:https://github.com/deepseek-ai/Janus/blob/main/janus_pro_tech_report.pdf7B 版本:https://huggingface.co/deepseek-ai/Janus-Pro-7B1B 版本:https://huggingface.co/deepseek-ai/Janus-Pro-1BHugging Face 试用链接:https://huggingface.co/spaces/deepseek-ai/Janus-Pro-7BDeepSeek 如今正将其影响力从语言处理,扩展到计算机视觉领域。据随模型发布的技术论文介绍,Janus Pro 7B 在效率和多功能性方面经过精心设计,能够在一系列视觉任务中表现出色:从生成逼真的图像到执行复杂的视觉推理任务。Janus-Pro 与其前身 Janus 在文本生成图像方面的对比DeepSeek 还展示了 Janus Pro 7B 的性能指标。(左)Janus Pro 7B 在比其他多模态大模型参数更少的情况下,依然实现了较高的性能。(右)该模型在文本生成图像基准测试中也取得了最高的准确率,超越了竞争对手(包括 DALL・E 3 和 SD3-Medium)。Janus-Pro 的多模态理解与视觉生成结果DeepSeek 研究团队在他们的论文中表示:「Janus Pro 是一个高效的视觉模型系列,旨在实现性能与计算成本之间的平衡,能够在广泛的视觉任务中实现最先进的性能。」以下为 Janus Pro 在多模态任务中的优良表现:图片描述文生图1. Janus Pro 架构对效率的强调是 Janus Pro 7B 区别于其他大规模、高资源需求 AI 模型的关键优势。与一些最大且最耗资源的 AI 模型不同,Janus Pro 7B 通过其 70 亿参数设计,能够提供高水平的性能,同时避免了对庞大计算资源的需求。Janus-Pro 的架构与 Janus 相同。如下图所示,整体架构的核心设计原则是将多模态理解与生成的视觉编码解耦。研究者应用独立的编码方法将原始输入转换为特征,这些特征随后由一个统一的自回归 Transformer 处理。Janus-Pro 架构2. 训练策略优化Janus 的前一个版本采用了三阶段训练过程:阶段 I:重点训练适配器和图像头。阶段 II:进行统一预训练。在此过程中,除理解编码器和生成编码器外,所有组件的参数都会被更新。阶段 III:进行监督微调。在阶段 II 的基础上,进一步解锁理解编码器的参数。然而,这种训练策略存在一些问题。通过进一步的实验,DeepSeek 研究团队发现这一策略并不最优,并导致了显著的计算效率低下。为解决此问题,他们在原有基础上进行了两项修改:在阶段 I 延长训练时间:研究者增加了阶段 I 的训练步数,以确保在 ImageNet 数据集上得到充分的训练。他们经过研究发现,即使固定了大语言模型(LLM)的参数,该模型仍能有效地建模像素间的依赖关系,并根据类别名称生成合理的图像。在阶段 II 进行重点训练:在阶段 II 中,研究者去除了 ImageNet 数据,直接使用标准的文本生成图像数据来训练模型,从而使模型能够基于详细的描述生成图像。这种重新设计的方法使得阶段 II 能够更高效地利用文本生成图像的数据,并显著提高了训练效率和整体性能。3. 数据扩展研究团队在 Janus 的训练数据上进行了扩展,涵盖了多模态理解和视觉生成两个方面:多模态理解:对于阶段 II 的预训练数据,参考 DeepSeek-VL2 ,并增加了大约 9000 万条样本。样本包括图像标注数据集,以及表格、图表和文档理解的数据。视觉生成:前一个版本的 Janus 使用的真实世界数据质量较差,且包含大量噪声,导致文本生成图像时不稳定,生成的图像质量较差。在 Janus-Pro 中,研究者加入了大约 7200 万条合成的美学数据样本,在统一预训练阶段,真实数据和合成数据的比例为 1:1。4. 模型扩展前一个版本的 Janus 通过使用 1.5B 的大语言模型(LLM)验证了视觉编码解耦的有效性。在 Janus-Pro 中,研究团队将模型扩展至 7B,并在其中详细列出了 1.5B 和 7B LLM 的超参数(见下表)。他们观察到,当扩大 LLM 的规模时,无论是在多模态理解还是视觉生成任务中,损失函数的收敛速度相比于较小的模型都会有显著的提升。这个发现进一步验证了该方法的强大可扩展性。Janus-Pro 架构配置Janus-Pro 训练的详细超参数JanusFlow-1.3B在发布 Janus Pro 的同时,DeepSeek 还发布了一个多模态理解模型 JanusFlow-1.3B。从名字也能看出来,参数量同样不高。据介绍,JanusFlow 是一个将图像理解和生成统一在一个模型中的强大框架。其引入了一种极简主义架构,将自回归语言模型与校正流(rectified flow,一种生成建模的 SOTA 方法)相结合。JanusFlow 的架构DeepSeek 研究表明,校正流可以在大型语言模型框架内直接训练,无需进行复杂的架构修改。为了进一步提高统一模型的性能,他们还采用了两种关键策略:一是将理解和生成编码器解耦,二是在统一训练期间对齐它们的表征。事实上, JanusFlow 的研究论文早在去年 11 月就已经发布。论文标题:JanusFlow: Harmonizing Autoregression and Rectified Flow for Unified Multimodal Understanding and Generation论文地址:https://arxiv.org/pdf/2411.07975当时的实验结果表明,JanusFlow 在不同的领域中都实现了与专门模型相当或更优异的性能,同时在标准基准上明显优于现有的统一方法。因此,可以说,这项研究代表着向更高效和多功能的视觉语言模型迈出的重要一步。下图展示了其一些基准测试结果数据以及生成结果。DeepSeek 两连击:提升市场焦虑与竞争压力Janus Pro 7B 的发布引发了不少讨论,比如 VentureBeat 认为:「Janus Pro 7B 的发布时机放大了其影响力。这是紧随 R1 模型和随之而来的市场动荡之后,它强化了这样的叙事:DeepSeek 是能够颠覆 AI 既定秩序的创新者。」该媒体还认为:「Janus Pro 7B 的开源性质会加剧这种颠覆。与之前的开源运动一样,这会让人们更容易使用高级 AI。大型科技公司以外的企业将受益:无需供应商锁定或高额费用即可获得顶级 AI。对于 AI 巨头来说,DeepSeek 构成了直接威胁:他们的专有高级模型能否在免费、高质量的替代品面前生存下来?当前的股市抛售情况表明投资者对此表示怀疑。」对于 DeepSeek 正在给 AI 社区以及投资市场带来的影响,你有什么看法,请与我们分享。https://venturebeat.com/ai/deepseek-unleashes-janus-pro-7b-vision-model-amidst-ai-stock-bloodbath-igniting-fresh-fears-of-chinese-tech-dominance/koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:高尚德
TOP1热点:尹锡悦被捕
报道称,南非金砖国家事务协调人阿尼尔·苏克拉尔20日在媒体吹风会上透露,南非总统拉马福萨决定邀请非洲大陆所有国家领导人,是因为金砖国家一直积极参与非洲事务,而南非认为,在担任轮值主席国期间,利用这段时间促进非洲大陆的发展是很重要的,尤其要把焦点集中在非洲大陆自由贸易协定上。。
TOP2热点:洛杉矶富人有钱能让山火改道
詹德斌则认为,尹锡悦实际上就是搞“阵营外交”,坚定地站在以美国为首的西方国家一侧,积极采取西方国家希望他采取的外交政策,以博得西方阵营的认可,“从而扩大和提升韩国所谓的国际作用和国际地位”。
詹德斌则认为,尹锡悦实际上就是搞“阵营外交”,坚定地站在以美国为首的西方国家一侧,积极采取西方国家希望他采取的外交政策,以博得西方阵营的认可,“从而扩大和提升韩国所谓的国际作用和国际地位”。
TOP3热点:蚂蚁抱团过火海真的存在吗四川少妇BBw搡BBBB槡BBBB
中国在台湾问题上的立场已经表述得再清楚不过,日本不能装糊涂。台湾是中国的,是一定要统一的,至于用什么方式统一取决于台海形势的演变以及外部势力的介入程度,这是中国的内部事务,日本、美国等任何国家、任何力量都无权干涉。最希望和平统一的无疑是海峡两岸的中华儿女,但是像日本、美国这样的外部势力,以及台湾岛内的“台独”分子,正内外勾连、想方设法破坏和平统一的环境和条件,将台海推向兵凶战危的境地。
今年6月13日,中国篮协副主席徐济成对外表示:“归化对中国篮球有利,但绝不是中国篮协一家能决定的,需要一套漫长的流程。现在走得比较顺利。耐心等待,必有收获。”
TOP4热点:洛杉矶富人有钱能让山火改道反差婊吃瓜黑料热门网曝
娄女士称,事发后她曾去公寓内探查,发现这栋33楼的公寓在30楼往上的楼道内堆放了很多砖头、瓷砖等,“(这些)就直接给了犯罪人员工具,让他能随便到天台上往下扔,给行凶提供了条件,物业和我说这些是住户装修的材料,并且他们说自己没有责任,让我走法律途径。”
她唯一感觉不爽的就是,老郭不能娶她。因为老郭答应过妻子,不和妻子离婚。
TOP5热点:欧盟称去年是自 1850 年以来最热年份积积桶积积免费软件网站
(原标题:马克龙高级顾问博纳声称中国正向俄提供可用作军事装备物品,中方驳斥)
TOP6热点:抖音直播话术要点小芳好大⋯太涨⋯快点视频
“从来没有一个来自西方国家的战争罪犯被审判”。冈比亚政府宣布退出国际刑事法院时,就直指该法院的“双标”行为:涉嫌“迫害和羞辱有色人群,尤其是非洲人”。冈比亚通讯部长博章称,2002年以来,至少有30个西方国家曾对其它独立主权国家和公民犯下了“令人发指”的战争罪,但从来没有一个来自西方国家的战争罪犯被审判。以美国为例,美国建国200多年以来,先后发动了侵略阿富汗战争、侵略伊拉克战争、轰炸叙利亚等各种军事行动了,造成大量的妇女、儿童和弱势群体死亡。除了卡特、特朗普等极少数总统之外,大部分总统都是“战时总统”。按照国际刑事法院的规则,它最应该向历届美国总统发出逮捕令。
其中蕴含的第三个要向美方传递的重要信号是:要用发展的眼光看问题。
TOP7热点:央视曝光美甲安全隐患日本sparksparkling调
共同民主党议员金炳柱批评称,总统最大的责任是守护国民的安全和生命,一些韩国网民也在相关报道下表示不满。当地媒体报道称,虽然气候变化导致极端天气现象越来越频繁,但政府事前对策存在局限性是事实。韩国去年8月的暴雨也曾造成巨大损失,政府今年承诺做好“彻底的”事前准备,但仍未能阻止灾难发生,因此不得不再次针对政府灾难管理方面出现漏洞予以指责。
3,白俄罗斯怎么办?所以,卢卡申科将瓦格纳安置在了白俄罗斯中部,远离波兰。
TOP8热点:运动爱好者的过年三件套苏州晶体公司ios
她谎称不能生育,很容易的诈骗了王超六万多。
TOP9热点:宝石盆景是什么体内㴬精69XXXXXx白浆
共同民主党议员金炳柱批评称,总统最大的责任是守护国民的安全和生命,一些韩国网民也在相关报道下表示不满。当地媒体报道称,虽然气候变化导致极端天气现象越来越频繁,但政府事前对策存在局限性是事实。韩国去年8月的暴雨也曾造成巨大损失,政府今年承诺做好“彻底的”事前准备,但仍未能阻止灾难发生,因此不得不再次针对政府灾难管理方面出现漏洞予以指责。
俄罗斯专家们认为,俄军对敖德萨地区的袭击将继续,“直到敖德萨和其他黑海城市的港口基础设施不仅不能用于军事目的,而且也不能用于政治目的”。
TOP10热点:加州伊顿大火近一半得到控制国产性猛交❌XX❌乱
她的丈夫和家人,都知道她是一个骗子了。