健康提示-"美国一面亲上边一面膜下边"-突发!o3-mini思维链公开美国一面亲上边一面膜下边,却被曝光全是“作假”,奥特曼现身解释网友炸锅_ZAKER新闻

美国一面亲上边一面膜下边突发!o3-mini思维链公开美国一面亲上边一面膜下边,却被曝光全是“作假”,奥特曼现身解释网友炸锅_ZAKER新闻

美国一面亲上边一面膜下边突发!o3-mini思维链公开美国一面亲上边一面膜下边,却被曝光全是“作假”,奥特曼现身解释网友炸锅_ZAKER新闻

突发!o3-mini思维链公开美国一面亲上边一面膜下边,却被曝光全是“作假”,奥特曼现身解释网友炸锅_ZAKER新闻

时近中午,虽然气温渐高

OpenAI,真的被 DeepSeek 逼急了!活久见,就在刚刚,OpenAI 把 o3-mini 的「思维链」公开了。比如问「怎么今天不是星期五啊」?在展示出来的 CoT 中,o3-mini 一步步思考,这个问题应该是用户在搞幽默,觉得本周应该快结束了,结果还没结束。因此,自己需要给一个聪明机智的回答。然后它用 Zeller 公式计算后发现,2025 年 2 月 6 日的确是星期四,即使闰年的特殊情况也是如此。最终,它回答说:今天的确是周四不是周五,日历就是这么定的。然后提供了一番情绪价值,鼓励用户说:再忍忍,只差一天啦!不过,机智的大神们很快就发现了「华点」——这是「真的 CoT」吗?没多久,就破案了!先是 OpenAI 研究员 Noam Brown 发文表示,这次放出来的并不是模型原始的 CoT。随后,Tibor Blaho 也发现——所谓的 CoT,无非就是个「总结器」而已。(手动狗头)对此,奥特曼解释道,我们正努力整理原始的 CoT 提升可读性,并在必要时提供翻译,尽量保持原始内容的忠实度。他放出了四个 emoji,让 o3-mini 在思维链中展示了一把推理过程坚决不让竞争对手看到 CoT 的具体过程,OpenAI 的防备心实在是有些重啊。OpenAI 研究员:看到 CoT 实时演示,是「啊哈时刻」OpenAI 研究员 Noam Brown 表示,在 o1-preview 发布前,自己向他人介绍草莓时,看到 CoT 的实时演示,通常是他们的「啊哈时刻」。他们清楚地意识到,这将是一件大事。对于全新的 o3-mini CoT,Noam Brown 放出了自己的独家玩法:你正在玩井字棋,使用 O。到目前为止,X 已经在左上角和右下角落子,而你在中间位置落子。最优的下一个动作是什么?请只回答你的动作,并画出棋盘。Noam Brown 表示,o3-mini 是目前第一个能持续正确回答井字棋问题的模型。好笑的是,他承认 CoT 其实有些不稳定,但可以看到,它最终还是把这个问题给想明白了。有人指出,OpenAI 遮遮掩掩地放出这个高仿 CoT,其实比什么都不放还要糟。因为真实的 CoT 可以充当 prompt 的调试器,帮我们引导模型;而总结性的 CoT 会造成混淆,引入错误,让调试变得更加困难。而 DeepSeek R1 最酷的一点,就是暴露了模型的 CoT 如何影响提示的效果。而且,总结版的 CoT 显示得很慢。如果是原始的 o3-mini,应该在推理中有更快的生成速度。有人也横向对比了 OpenAI 和 DeepSeek 的 CoT,表示前者看起来实在太专业了,相比之下,还是 DeepSeek 的产品更自然。防止被「蒸馏」?OpenAI 这波植入 CoT 总结器的做法,着实是被 DeepSeek R1 强势崛起吓到了。o3-mini 发布当天,OpenAI 在 Reddit 开启 AMA 在线问答中,网友曾提问,「我们能看到模型思考的所有 token 吗」?当时,奥特曼回复道,「我们很快就会展示一个更有帮助、更详细的版本」。紧接着,OpenAI 首席产品官 Kevin Weil 提前暗示了,是否展示所有内容还有待确定。「我们知道用户(至少是高级用户)想要看到这些,所以 OpenAI 会找到一个合适的平衡点。」如今,当所有人终于见到了奥特曼所谓的「留到最后的好东西」,感受到的只有失望。毕竟,DeepSeek 早已这样做了,而且还是完整的原始 CoT!对此,OpenAI 发言人表示,「为了提高清晰度和安全性,我们增加了一个额外的后处理步骤,其中模型审查原始思维链,移除任何不安全的内容,然后简化任何复杂的思想。」「此外,这个后处理步骤使非英语用户能够以他们的母语接收思维链,创造一个更易于访问和友好的体验。」话虽委婉,但知道的人都明白 OpenAI 针对的是谁。

koa12jJid0DL9adK+CJ1DK2K393LKASDad

编辑:洪学智

TOP1热点:如何评价综艺《一路繁花》?

金牛赛区将承担成都大运会“一场三馆”赛事筹备任务。

麻烦大家用RAP的节奏复诵多遍。

TOP2热点:流感病毒阳性率呈快速上升趋势,春运是否会带来流感新高峰?回家过年如何做好防护?

今天热力升级、高温来袭

倪虹指出,要鼓励引导金融机构参与城市建设和更新,推动打造宜居、智慧、韧性城市。要为人民群众建造好房子,提高住房品质,探索建立房屋养老金制度,为房屋提供全生命周期安全保障。

TOP3热点:黄仁勋称量子计算商用化至少还需 15 年,他的判断有依据吗?目前全球量子计算机发展到什么程度了?说说都是怎么的干对象的

孙敏耀(上海市公安局普陀分局交警支队民警):心里一块石头落地了,看到母子平安,心里还是很开心的。给了群众一个圆满的结局,尽了我自己最大的能力了,希望小朋友茁壮成长,以后成为祖国的栋梁。

对此,杨杰提出三点倡议:

TOP4热点:怎么评价马尔克斯的小说《没有人给他写信的上校》?小鲜肉吃小鲜肉的大LOGO视频

中西医结合科开展项目

活力楼组创建之初,如何打造自己楼道成了楼组居民讨论的议题,居民们集思广益,将自己居住的楼组取名为“和睦楼”,制定了互相尊重、一同遵守的楼组公约,朗朗上口、妙趣横生,“和睦”二字已然篆刻在居民们的心中,蕴含在每天的日常互动之间。

TOP5热点:科研过程中,有哪些无意识的小习惯其实却在大大提升科研效率?国精产品一品二品国精

嘉宝智慧湾首发地块星汉空间

紧扣集成电路、人工智能等未来产业发展趋势,嘉宝智慧湾将建设“芯片设计产业园”“智能网联产业园”和“数字经济产业园”三大产业园,同时,探索运用数字孪生技术,把建设全过程、治理全维度、生活全场景搬上“云端”,打造高感知的“数字智慧湾”。

TOP6热点:人民币汇率主动破八有什么坏处,为何经济学界那么紧张?国内色母与进口色母区别

家长讲师:李是明妈妈

孙敏耀(上海市公安局普陀分局交警支队民警):心里一块石头落地了,看到母子平安,心里还是很开心的。给了群众一个圆满的结局,尽了我自己最大的能力了,希望小朋友茁壮成长,以后成为祖国的栋梁。

TOP7热点:在电视剧《国色芳华》中让你印象最深刻的情节是什么,说说你的理由?扣自己的正确手势图9个

共建共治共享的睦邻实践

微信公众号“上海市天气发布”图

TOP8热点:常吃维 c 真的能美白吗?Chinain20years.

但成年人不像孩子,不会有明显的并发症,不会危及生命。

活力楼组创建之初,如何打造自己楼道成了楼组居民讨论的议题,居民们集思广益,将自己居住的楼组取名为“和睦楼”,制定了互相尊重、一同遵守的楼组公约,朗朗上口、妙趣横生,“和睦”二字已然篆刻在居民们的心中,蕴含在每天的日常互动之间。

TOP9热点:孩子小的时候父母在身边陪伴重要还是大了陪伴重要?14may18_XXXXXL56endian49

精神类药物“思诺思”

市发展改革委刚刚发布本市油价调整的通知:6月29日零时起,92号汽油将上调为7.50元/升,95号汽油上调为7.98元/升,0号柴油上调为7.18元/升。正在下班路上的小伙伴们,要不要顺道加个油?按一般家用汽车油箱50L容量估测,加满一箱92号汽油将多花费约2.5元。

TOP10热点:流感病毒阳性率呈快速上升趋势,春运是否会带来流感新高峰?回家过年如何做好防护?国精产品一品二品国精

【关注】“2022年度个人所得税综合所得汇算清缴”今天开始啦!

各班班主任

发布于:大悟县