经济前沿-"丰满肥了BwwBBww"-DeepSeek砍掉英伟达台积电5万亿市值！登五大外媒头版丰满肥了BwwBBww，OpenAI急得发预告

DeepSeek砍掉英伟达台积电5万亿市值！登五大外媒头版丰满肥了BwwBBww，OpenAI急得发预告_ZAKER新闻

在6月“兵变”事件平息后，瓦格纳集团成员陆续移动至白俄罗斯。美国有线电视新闻网（CNN）日前报道称，白俄罗军队同瓦格纳集团人员正继续组织进行联合训练，还将于本周在靠近白俄罗斯与波兰边境附近举行联合军事演习。

一只蓝色鲸鱼，正在硅谷和华尔街掀起海啸。智东西 1 月 28 日报道，震动美股的 " 国产 AI 之光 "DeepSeek，在疯狂霸屏主流美媒头版、令美股科技股血流成河后，今日乘势追击——发布全新开源多模态 AI 模型 Janus-Pro！OpenAI 显然也感受到 DeepSeek 带来的压力。今日，OpenAI 联合创始人兼 CEO Sam Altman 连发多条推文，难得公开夸赞 DeepSeek R1，称这是一款 " 令人印象深刻的模型 "。接着他给自家模型打广告，说 OpenAI 将推出更好的模型，而且会继续执行原有路线图，相信更多计算比以往任何时候都更重要。根据 DeepSeek 披露的信息，新开源模型 Janus-Pro-7B 在 GenEval 和 DPG-Bench 基准测试中，性能击败 OpenAI DALL-E 3 和 Stable Diffusion。这显然又戳中了业界的兴奋点，网友们在社交平台发出各种梗图。其中一张图给 GPT-5 打了个大红叉，在巨鲸身上放了个大大的 DeepSeek logo。此前 DeepSeek 新模型 R1 的发布，凭借前所未有的高性能和成本效益，彻底坐实了 " 国产 AI 价格屠夫 " 的标签，令整个硅谷惊慌失措，业界对美国科技巨头重资砸向 AI 基础设施的必要性产生质疑。（突发！DeepSeek 暴击美股，让整个硅谷坐立不安）随着影响力快速发酵，DeepSeek 登顶中美等多国 App Store 免费榜。受 DeepSeek 冲击美股影响，英伟达昨日股价暴跌 17%，收于 118.42 美元 / 股，市值蒸发近 6000 亿美元（折合人民币近 4.35 万亿元）。一天之内，排名彭博亿万富豪榜第 15 名的英伟达创始人兼 CEO 黄仁勋财富缩水 201 亿美元（约合人民币 1458 亿元）。其晶圆代工供应商台积电的市值也在昨日蒸发了 1508 亿美元（约合人民币 1.09 万亿元）。等于 DeepSeek 作为 "AI 界拼多多 "，一刀 " 砍掉 " 了英伟达和台积电共超 5 万亿元市值，实属罕见。美股科技股、芯片股均受重挫，纳斯达克 100 指数下跌 3.1%，标普 500 指数下跌 1.5%，微软下跌 2.14%，谷歌母公司 Alphabet 下跌 4.03%，博通下跌 17.40%，台积电下跌 13.33%，ASML 下跌 5.75%，为 AI 基础设施提供电气硬件的西门子能源下跌 20%，电力产品制造商施耐德电气下跌 9.5%…… 对 AI 竞赛并不热衷的苹果则安然无恙，在一众暴跌的科技股中逆势上涨 3.2%，重返全球市值第一。多家主流外媒的网站头版都是针对 DeepSeek 的报道，这十分少见。随着以闪电速度陆续开源高质量新模型，DeepSeek 在全球科技圈引起的轰动效应还在持续扩大。新发布的 Janus-Pro 有 1B 和 7B 两款尺寸，能输出生成高质量的 AI 图像，一如既往开源、免费、可商用。13 页技术报告已经公开。"Janus-Pro 超越了之前的统一模型，达到甚至超过了特定任务模型的性能。"DeepSeek 在一篇文章中写道，"Janus-Pro 的简单性、高灵活性和有效性使其成为下一代统一多模态模型的有力候选者。"网友们已经在社交平台上积极晒出对 Janus-Pro-7B 的体验。总体来看，Janus-Pro-7B 的信息理解基本准确，生成图像很完整，在局部细节上相对有欠缺。以下是 DeepSeek 最新多模态理解和生成模型 Janus-Pro 的技术解读：根据技术报告，Janus-Pro 是前作 Janus 的升级版，结合了优化的训练策略、扩展的训练数据，并扩展到更大的模型尺寸，在多模态理解和文本到图像的指令遵循能力方面都取得了显著进步，同时也增强了文生图的稳定性。技术报告：https://github.com/deepseek-ai/Janus/blob/main/janus_pro_tech_report.pdfJanus-Pro 只能分析分辨率至多 384 x 384 的小图像。但考虑到模型尺寸很小，其性能令人印象深刻，相比前代输出了更好的视觉质量、更丰富的细节，并具备生成简单文本的能力。对于富有想象力和创造性的场景，Janus-Pro-7B 能够从提示中准确捕获语义信息，产生合理和连贯的图像。Janus-Pro 1B 模型更适合需要紧凑高效的 AI 任务，比如在消费级硬件上做轻量化部署。这款模型同样在 GenEval 等基准测试中取得了较高的平均性能，证明它能够以更少资源在指令遵循和图像分析上表现出色。此前一些统一多模态理解和生成模型方法已被证明可以增强视觉生成任务中的指令遵循能力，同时减少模型冗余。它们大多使用相同的视觉编码器来处理多模态理解和生成任务的输入。由于两个任务所需的表示不同，这通常会导致多模态理解中的次优性能。为了解决这个问题，Janus 提出了解耦视觉编码，将视觉理解与图像生成任务分开，确保两个任务不会互相干扰，从而在多模态理解和生成任务中都取得了优异的性能。Janus 在 1B 参数尺寸上进行了验证，但受限于训练数据量和相对较小的模型容量，它表现出一定的缺点，例如短提示图像生成的性能不理想、文生图质量不稳定。Janus-Pro 则是 Janus 的增强版，着重改进了训练策略、数据和模型大小。新模型遵循一款自回归框架，解耦了多模态理解和视觉生成的视觉编码。研究团队采用独立的编码方法将原始输入转换为特征，然后由统一的自回归 Transformer 进行处理。其实验使用最大支持序列长度为 4096 的 DeepSeek 大模型（1.5B 和 7B）作为基础模型。对于多模态理解，研究人员使用 SigLIP-Large-Patch16-384 编码器从图像中提取高维语义特征，将这些特征从二维网格平展到一维序列，并使用理解适配器将这些图像特征映射到大语言模型的输入空间中。对于视觉生成任务，研究人员使用 VQ tokenizer 将图像转换为离散 ID，在将 ID 序列平面化为 1-D 后，使用生成适配器将每个 ID 对应的码本嵌入映射到大语言模型的输入空间中，然后将这些特征序列连接起来形成一个多模态特征序列，随后将其输入大语言模型进行处理。除了大语言模型中内置的预测头外，研究人员还在视觉生成任务中使用随机初始化的预测头进行图像预测。前代 Janus 模型采用了三阶训练过程：第一阶段的重点是训练适配器和图像头，第二阶段是使用多模态数据做统一预训练，第三阶段是进行监督微调。这种方法使 Janus 能够胜过更大的模型，同时保持可管理的计算占用空间。但经实验，其策略会导致大量计算效率低下。为此 DeepSeek 做了两处修改：一是增加第一阶段的训练步骤，允许在 ImageNet 数据集上进行足够的训练；二是在第二阶段，放弃 ImageNet 数据，直接利用正常的文生图数据来训练模型，以基于密集描述生成图像。这种重新设计的方法使第二阶段能够更有效地利用文生图数据，从而提高训练效率和整体性能。研究人员还调整了第三阶段监督微调过程中不同类型数据集的数据比例，将多模态数据、纯文本数据和文本到图像数据的比例从 7:3:10 更改为 5:1:4，使模型在保持出色视觉生成能力的同时，实现改进的多模态理解性能。Janus-Pro 将模型大小扩展到 7B。当使用更大规模的大语言模型时，与较小的模型相比，多模态理解和视觉生成的损失收敛速度都有显著提高。该发现进一步验证了这个方法的可扩展性。研究人员在训练过程中使用序列打包来提高训练效率，在单个训练步骤中根据指定的比例混合所有数据类型。Janus 使用轻量级高效分布式训练框架 HAI-LLM 进行训练和评估。对于 1.5B/7B 模型，在 16/32 个节点的集群上，每个节点配备 8 个英伟达 A100 ( 40GB ) GPU，整个训练过程大约需要 7/14 天。DeepSeek 在多个基准上对 Janus-Pro 进行了评估，结果显示了出色的多模态理解能力和显著提高的文生图指令遵循性能。比如 Janus-Pro-7B 在多模态理解基准 MMBench 上获得了 79.2 分，超过最先进的统一多模态模型；在文生图指令遵循基准测试 GenEval 中，Janus-Pro-7B 得分为 0.80，超过 Janus、Stable Diffusion 3 Medium、DALL-E 3、Emu3-Gen、PixArt-alpha 等先进图像生成模型。总体来看，Janus-Pro 在训练策略、数据、模型大小上的改进，使其取得多模态理解和文生图指令遵循能力的进步。该模型仍存在一定的局限性，例如在多模态理解方面，输入分辨率限制为 384 × 384 会影响其在细粒度任务（如 OCR 文本识别）中的性能。对于文生图，低分辨率加上视觉 tokenizer 带来的重建损失，导致图像虽然具有丰富的语义内容，但仍然缺乏精细的细节。例如，占用有限图像空间的小面部区域可能显得不够精细。技术报告指出，提高图像分辨率可以缓解这些问题。