丰满肥了BwwBBwwDeepSeek砍掉英伟达台积电5万亿市值!登五大外媒头版丰满肥了BwwBBww,OpenAI急得发预告_ZAKER新闻
DeepSeek砍掉英伟达台积电5万亿市值!登五大外媒头版丰满肥了BwwBBww,OpenAI急得发预告_ZAKER新闻
在6月“兵变”事件平息后,瓦格纳集团成员陆续移动至白俄罗斯。美国有线电视新闻网(CNN)日前报道称,白俄罗军队同瓦格纳集团人员正继续组织进行联合训练,还将于本周在靠近白俄罗斯与波兰边境附近举行联合军事演习。
一只蓝色鲸鱼,正在硅谷和华尔街掀起海啸。智东西 1 月 28 日报道,震动美股的 " 国产 AI 之光 "DeepSeek,在疯狂霸屏主流美媒头版、令美股科技股血流成河后,今日乘势追击——发布全新开源多模态 AI 模型 Janus-Pro!OpenAI 显然也感受到 DeepSeek 带来的压力。今日,OpenAI 联合创始人兼 CEO Sam Altman 连发多条推文,难得公开夸赞 DeepSeek R1,称这是一款 " 令人印象深刻的模型 "。接着他给自家模型打广告,说 OpenAI 将推出更好的模型,而且会继续执行原有路线图,相信更多计算比以往任何时候都更重要。根据 DeepSeek 披露的信息,新开源模型 Janus-Pro-7B 在 GenEval 和 DPG-Bench 基准测试中,性能击败 OpenAI DALL-E 3 和 Stable Diffusion。这显然又戳中了业界的兴奋点,网友们在社交平台发出各种梗图。其中一张图给 GPT-5 打了个大红叉,在巨鲸身上放了个大大的 DeepSeek logo。此前 DeepSeek 新模型 R1 的发布,凭借前所未有的高性能和成本效益,彻底坐实了 " 国产 AI 价格屠夫 " 的标签,令整个硅谷惊慌失措,业界对美国科技巨头重资砸向 AI 基础设施的必要性产生质疑。(突发!DeepSeek 暴击美股,让整个硅谷坐立不安)随着影响力快速发酵,DeepSeek 登顶中美等多国 App Store 免费榜。受 DeepSeek 冲击美股影响,英伟达昨日股价暴跌 17%,收于 118.42 美元 / 股,市值蒸发近 6000 亿美元(折合人民币近 4.35 万亿元)。一天之内,排名彭博亿万富豪榜第 15 名的英伟达创始人兼 CEO 黄仁勋财富缩水 201 亿美元(约合人民币 1458 亿元)。其晶圆代工供应商台积电的市值也在昨日蒸发了 1508 亿美元(约合人民币 1.09 万亿元)。等于 DeepSeek 作为 "AI 界拼多多 ",一刀 " 砍掉 " 了英伟达和台积电共超 5 万亿元市值,实属罕见。美股科技股、芯片股均受重挫,纳斯达克 100 指数下跌 3.1%,标普 500 指数下跌 1.5%,微软下跌 2.14%,谷歌母公司 Alphabet 下跌 4.03%,博通下跌 17.40%,台积电下跌 13.33%,ASML 下跌 5.75%,为 AI 基础设施提供电气硬件的西门子能源下跌 20%,电力产品制造商施耐德电气下跌 9.5%…… 对 AI 竞赛并不热衷的苹果则安然无恙,在一众暴跌的科技股中逆势上涨 3.2%,重返全球市值第一。多家主流外媒的网站头版都是针对 DeepSeek 的报道,这十分少见。随着以闪电速度陆续开源高质量新模型,DeepSeek 在全球科技圈引起的轰动效应还在持续扩大。新发布的 Janus-Pro 有 1B 和 7B 两款尺寸,能输出生成高质量的 AI 图像,一如既往开源、免费、可商用。13 页技术报告已经公开。"Janus-Pro 超越了之前的统一模型,达到甚至超过了特定任务模型的性能。"DeepSeek 在一篇文章中写道,"Janus-Pro 的简单性、高灵活性和有效性使其成为下一代统一多模态模型的有力候选者。"网友们已经在社交平台上积极晒出对 Janus-Pro-7B 的体验。总体来看,Janus-Pro-7B 的信息理解基本准确,生成图像很完整,在局部细节上相对有欠缺。以下是 DeepSeek 最新多模态理解和生成模型 Janus-Pro 的技术解读:根据技术报告,Janus-Pro 是前作 Janus 的升级版,结合了优化的训练策略、扩展的训练数据,并扩展到更大的模型尺寸,在多模态理解和文本到图像的指令遵循能力方面都取得了显著进步,同时也增强了文生图的稳定性。技术报告:https://github.com/deepseek-ai/Janus/blob/main/janus_pro_tech_report.pdfJanus-Pro 只能分析分辨率至多 384 x 384 的小图像。但考虑到模型尺寸很小,其性能令人印象深刻,相比前代输出了更好的视觉质量、更丰富的细节,并具备生成简单文本的能力。对于富有想象力和创造性的场景,Janus-Pro-7B 能够从提示中准确捕获语义信息,产生合理和连贯的图像。Janus-Pro 1B 模型更适合需要紧凑高效的 AI 任务,比如在消费级硬件上做轻量化部署。这款模型同样在 GenEval 等基准测试中取得了较高的平均性能,证明它能够以更少资源在指令遵循和图像分析上表现出色。此前一些统一多模态理解和生成模型方法已被证明可以增强视觉生成任务中的指令遵循能力,同时减少模型冗余。它们大多使用相同的视觉编码器来处理多模态理解和生成任务的输入。由于两个任务所需的表示不同,这通常会导致多模态理解中的次优性能。为了解决这个问题,Janus 提出了解耦视觉编码,将视觉理解与图像生成任务分开,确保两个任务不会互相干扰,从而在多模态理解和生成任务中都取得了优异的性能。Janus 在 1B 参数尺寸上进行了验证,但受限于训练数据量和相对较小的模型容量,它表现出一定的缺点,例如短提示图像生成的性能不理想、文生图质量不稳定。Janus-Pro 则是 Janus 的增强版,着重改进了训练策略、数据和模型大小。新模型遵循一款自回归框架,解耦了多模态理解和视觉生成的视觉编码。研究团队采用独立的编码方法将原始输入转换为特征,然后由统一的自回归 Transformer 进行处理。其实验使用最大支持序列长度为 4096 的 DeepSeek 大模型(1.5B 和 7B)作为基础模型。对于多模态理解,研究人员使用 SigLIP-Large-Patch16-384 编码器从图像中提取高维语义特征,将这些特征从二维网格平展到一维序列,并使用理解适配器将这些图像特征映射到大语言模型的输入空间中。对于视觉生成任务,研究人员使用 VQ tokenizer 将图像转换为离散 ID,在将 ID 序列平面化为 1-D 后,使用生成适配器将每个 ID 对应的码本嵌入映射到大语言模型的输入空间中,然后将这些特征序列连接起来形成一个多模态特征序列,随后将其输入大语言模型进行处理。除了大语言模型中内置的预测头外,研究人员还在视觉生成任务中使用随机初始化的预测头进行图像预测。前代 Janus 模型采用了三阶训练过程:第一阶段的重点是训练适配器和图像头,第二阶段是使用多模态数据做统一预训练,第三阶段是进行监督微调。这种方法使 Janus 能够胜过更大的模型,同时保持可管理的计算占用空间。但经实验,其策略会导致大量计算效率低下。为此 DeepSeek 做了两处修改:一是增加第一阶段的训练步骤,允许在 ImageNet 数据集上进行足够的训练;二是在第二阶段,放弃 ImageNet 数据,直接利用正常的文生图数据来训练模型,以基于密集描述生成图像。这种重新设计的方法使第二阶段能够更有效地利用文生图数据,从而提高训练效率和整体性能。研究人员还调整了第三阶段监督微调过程中不同类型数据集的数据比例,将多模态数据、纯文本数据和文本到图像数据的比例从 7:3:10 更改为 5:1:4,使模型在保持出色视觉生成能力的同时,实现改进的多模态理解性能。Janus-Pro 将模型大小扩展到 7B。当使用更大规模的大语言模型时,与较小的模型相比,多模态理解和视觉生成的损失收敛速度都有显著提高。该发现进一步验证了这个方法的可扩展性。研究人员在训练过程中使用序列打包来提高训练效率,在单个训练步骤中根据指定的比例混合所有数据类型。Janus 使用轻量级高效分布式训练框架 HAI-LLM 进行训练和评估。对于 1.5B/7B 模型,在 16/32 个节点的集群上,每个节点配备 8 个英伟达 A100 ( 40GB ) GPU,整个训练过程大约需要 7/14 天。DeepSeek 在多个基准上对 Janus-Pro 进行了评估,结果显示了出色的多模态理解能力和显著提高的文生图指令遵循性能。比如 Janus-Pro-7B 在多模态理解基准 MMBench 上获得了 79.2 分,超过最先进的统一多模态模型;在文生图指令遵循基准测试 GenEval 中,Janus-Pro-7B 得分为 0.80,超过 Janus、Stable Diffusion 3 Medium、DALL-E 3、Emu3-Gen、PixArt-alpha 等先进图像生成模型。总体来看,Janus-Pro 在训练策略、数据、模型大小上的改进,使其取得多模态理解和文生图指令遵循能力的进步。该模型仍存在一定的局限性,例如在多模态理解方面,输入分辨率限制为 384 × 384 会影响其在细粒度任务(如 OCR 文本识别)中的性能。对于文生图,低分辨率加上视觉 tokenizer 带来的重建损失,导致图像虽然具有丰富的语义内容,但仍然缺乏精细的细节。例如,占用有限图像空间的小面部区域可能显得不够精细。技术报告指出,提高图像分辨率可以缓解这些问题。koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:李文信
TOP1热点:9块9竟能克隆雷军声音带货
同样不知道哥哥现状的,还有来自湖南汨罗的奉江。7月18日,他告诉记者,和哥哥最后一次联系是在5月,“他说快救救我,我可能承受不住会自杀。”。
TOP2热点:董明珠暗讽有人靠炒高股价成了首富
奉江的妈妈身体本就不好,第一次得知儿子被骗到缅甸时病情加重,被送往医院抢救。“我哥被卖到第三家公司后,跟妈妈视频过一次,那时候牙齿都被打掉了。现在我妈已经有点‘神经病’了,老是念念叨叨的。”
再看美国国务院发言人的表态:一边极力撇清关系,说基辛格访华是个人行为,与美国政府无关,一边说,“相信基辛格会像往常一样,向美方官员介绍情况。”
TOP3热点:家属回应小伙游华山失联多日孤男寡女干柴烈火的比喻意思
老郭要应付三个女人,他虽说不和妻子住在一起了,但是,平时还是要对妻子嘘寒问暖的。他有点心有余而力不足。
TOP4热点:小车滚落山崖致5人遇难 亲属发声14may18_XXXXXL56endian印
中方通过与基辛格的会见,讲了三点,值得美国认真听听。
TOP5热点:专家:尹锡悦获释后被罢免可能性大14may18_XXXXXL56endian印
看普京的表情,感觉是在努力憋住笑。
7月24日凌晨,现场救援仍在紧张进行。摄影/上游新闻记者张莹
TOP6热点:“超级充电宝”将布局全国pansy中老年妈妈
阿兵只是一个外地到上海打工的年轻人,手里根本没有太多积蓄。
到时候只要自己一口咬定阿兵已经退房离开了,根本没有人能够拿她怎么样。
TOP7热点:美国流浪宇航员为何成了星际弃儿欧美人与人动人物2020
知情人士告诉记者,体育馆旁曾经是一块空地,学校在此种植了向日葵和玉米等。去年年底,这块空地开始动工修建学校附属综合楼,但接连有师生注意到,有工人将施工用的袋装材料堆放在体育馆楼顶,令人担忧。“体育馆年久失修,大家都担心楼顶堆重物,会不会出事。”
“事发已经七八个小时了,还没有孩子的消息。”这名家属称,孩子母亲因伤心过度晕倒送医,他继续守在学校,等候救援消息。
TOP8热点:银行加速出清信用卡不良资产啊~嗯~㖭我下水好多水作文
履新20余天后,潘功胜赴日本,出席第十二届中日韩央行行长会议。
TOP9热点:南京一男子从商场9楼跳下身亡Gay引诱外卖员com2o22
另据了解,坍塌体育馆建筑面积约1200平方米,墙体为网架结构,顶棚为混凝土板。
TOP10热点:《北上》马奶奶脑溢血去世索14may18_XXXXXL56endian
当时,经由村中同辈最年长的表兄李天平介绍,凯尔·安德森依次与30多名家庭成员(李崇新之子李玉楼的后人)相互认识,随后被“赐名”李凯尔,并纳入族谱。李凯尔与李氏家人亲戚一起包汤圆、炒大锅饭,用筷子吃家常菜,喝白酒,甚至会在碰杯时压低酒杯。