buytake2挑战可以在哪看马斯克新 AI 破解千年难题却被紧急喊停?这个「玩buytake2挑战可以在哪看笑」怎么让 AI 圈一夜未眠_ZAKER新闻
马斯克新 AI 破解千年难题却被紧急喊停?这个「玩buytake2挑战可以在哪看笑」怎么让 AI 圈一夜未眠_ZAKER新闻
北京:截至8月8日,全市累计转移群众8.2万余人,因灾死亡33人,主要由洪水冲淹、冲塌房屋等原因造成;因抢险救援牺牲5人。还有18人失踪,包括1名抢险救援人员。
Grok-3 证明了「黎曼猜想」了?xAI 研究员 Hieu Pham 周末发布的一条推文在 AI 圈掀起轩然大波,推文原话是这么说的:Grok-3 AI 系统刚刚证明了黎曼猜想(Riemann ’ s hypothesis)。为了验证这一证明的正确性,我们决定暂停该系统的训练。如果证明被确认无误,我们将不再继续其训练,因为这样的 AI 被认为过于智能,可能对人类构成威胁。老规矩,先说结论,这单纯就是玩梗而已。然而,随着推文的不断发酵,还是迅速引发了超过两百万网友的关注与讨论,甚至辐射到海内外的 AI 舆论圈。事情的源头大概要追溯到网友 Andrew Curran 更早些时候的一则「爆料」,其声称 Grok-3 在训练过程中发生了灾难性事件。随后,各种离奇的传言纷至沓来。网友起哄说,OpenAI CEO Sam Altman 用巨大的激光器对准了 xAI 的最大训练集群,导致数据严重损坏;也有人煞有介事地暗示有人蓄意破坏下一代 LLM 训练运行。更有调侃称,AI 似乎获得了自我意识,并解决了黎曼猜想,但在证明代码中「故意省略了 15 个分号」,使人类无法验证。连 Runway 创始人 Crist ó bal Valenzuela 也来凑热闹:Gen-4 刚刚荣获了包括最佳影片在内的所有奥斯卡奖项。为了深入研究其在艺术领域的创新成果,我们决定暂停对其进行的训练。如果这部电影确实如早期评论家所言具有革命性,我们将不会恢复训练,因为这表明 AI 在艺术方面已经达到如此高的水平,以至于可能威胁到人类的创造力。谣言就这么越传越邪乎。多位 xAI 研究人员也纷纷转发 Andrew Curran 推文,加入这场集体「大团建」。比如我们的老熟人 xAI 联创 Greg Yang 率先调侃道,Grok-3 在训练过程中突然殴打办公室里年长的保安。另一位研究人员 Heinrich Kuttler 则表示:「是的,情况非常糟糕!我们后来用 nan(Not a Number,非数)把所有异常的权重都替换了一遍,才恢复。」当然,更理性的网友直接在 X 上询问当前版本的 Grok 对黎曼猜想的理解,不出所料, Grok 的表现十分「玛卡巴卡」。最终,这场闹剧由始作俑者—— xAI 研究员 Hieu Pham 亲自画上句号:好的,《周六夜现场》结束了。至于为什么证明黎曼假设是危险的,我强烈推荐马特 · 海格(@matthaig1)的精彩小说《人类》。那么问题来了,为什么这则 Grok-3 证明黎曼猜想的消息能引起广泛的关注呢?首先是黎曼猜想本身的重要性。黎曼猜想(Riemann Hypothesis)是数学中一个关于素数分布的重要猜想,由德国数学家伯恩哈德 · 黎曼于 1859 年提出,该猜想被列为克雷数学研究所(Clay Mathematics Institute)的「千年难题」之一。它涉及到黎曼 ζ 函数(Riemann zeta function),这个函数定义为:ζ ( s ) =1+12s+13s+14s+ ⋯ zeta ( s ) = 1 + frac{1}{2^s} + frac{1}{3^s} + frac{1}{4^s} + cdots ζ ( s ) =1+2s1+3s1+4s1+ ⋯黎曼猜想的核心内容是:所有非平凡的黎曼 ζ 函数零点的实部都等于 1/2。换句话说,如果 ss 是黎曼 ζ 函数的一个非平凡零点,即 ζ ( s ) =0 ζ ( s ) =0,那么其实部必定是 ℜ ( s ) =1/2 ℜ ( s ) =1/2。克雷数学研究所说了,如果有人能够成功证明黎曼猜想,将奖励 100 万美元的奖金。但这个猜想至今没有被证明或反驳,也被广泛认为是现代数论中的一个未解之谜。这个猜想的证明对于数论(数学的一个分支)有着深远的影响。目前,很多现代加密技术(比如保护网上支付、数据隐私等)都依赖于素数的性质。证明黎曼猜想或将会让人类更好地理解这些技术的基础,并且可能影响到未来的安全算法。假如 Grok-3 能证明黎曼猜想,这不仅将推动理论数学、物理学、密码学等领域的大幅进展,同时将标志着 AI 在推理和解决复杂问题方面的巨大进步。甚至可以说,这将成为人工智能超越人类智能的一个标志性事件。月之暗面创始人杨植麟曾表示,数学场景是锻炼 AI 思考能力最理想的场景。数学是一个极其严谨的逻辑体系,而 AI 的推理能力往往建立在严密的逻辑推导之上。AI 解决数学问题的过程实质上是一个持续思考的历程,在这个过程中,它会不断尝试不同思路,通过反复试错来寻找正确答案。即便计算过程中出现错误,AI 也能通过验证和校对来纠正结果。类似的理念也体现在 OpenAI o1 的强化学习训练上。如果说以前的大模型是学习数据,o1 更像在学习思维。就像我们解题,不仅要写出答案,也要写出推理过程。一道题目可以死记硬背,但学会了推理,才能举一反三。所以在今年美国针对优秀高中生的 AIME 测验当中,GPT-4o 仅完成了百分之十三的题目。相比之下,o1 的正确率高达 83 个百分点。就博士水准的 GPQA Diamond 科研测评而言,GPT-4o 获得了 56.1% 的成绩,而 o1 的表现更为出色。不仅胜过了人类博士的 69.7%,更是达到了 78% 的正确率。在国际信息学奥赛 ( IOI ) 的评测中,当每道题允许 50 次尝试时,模型达到了 49% 的得分率,即 213 分,而当每题提交机会增至一万次时,其最终得分提升至 362 分。拿打败围棋世界冠军的 AlphaGo 类比,就更加容易理解了。AlphaGo 就是通过强化学习训练的,先使用大量人类棋谱进行监督学习,然后与自己对弈,每局对弈根据输赢得到奖励或者惩罚,不断提升棋艺,甚至掌握人类棋手想不到的方法。o1 和 AlphaGo 有相似之处,不过 AlphaGo 只能下围棋,o1 则是一个通用的大语言模型。o1 学习的材料,可能是数学题库、高质量的代码等,然后 o1 被训练生成解题的思维链,并在奖励或惩罚的机制下,生成和优化自己的思维链,不断提高推理的能力。这其实也解释了,为什么 OpenAI 强调 o1 的数学、代码能力强,因为对错比较容易验证,强化学习机制能够提供明确的反馈,从而提升模型的性能。当然,更重要的是如何将这种推理能力拓展应用到更广泛的领域中。所以我们会看到不少海外网友为 Grok-3 证明黎曼猜想欢呼,「如果是这样的话,我们真的在见证一个巨大的突破。」马斯克曾多次在公开场合渲染 Grok-3 的强大,他声称 Grok-3 预计在年底前问世,并将成为「世界上最强大的 AI」。实际上,Grok-3 是由上面提到的 AI 初创公司 xAI 开发的第三代大型语言模型,并预计在性能上预期将超越现有的所有 AI 大模型。原因在于 Grok-3 训练背后依托的是目前世界上最大的 AI 训练集群—— Colossus。这个集群由 10 万个液冷英伟达 H100 GPU 组成,采用单一的 RDMA 网络互连架构。这个集群的规模已经超越了目前世界上任何其他的超级计算机,而且未来还将持续扩充 GPU 数量。根据 The Information 的报道,Colossus 的出现甚至引起了 Altman 的密切关注,后者派飞机飞越 Colossus 训练基地,试图窥探其开发进展和能源供应情况。所以说,当「最强 AI」、「千年数学难题」和以及长盛不衰的「AI 威胁论」这三重元素叠加,一场完美的「谣言风暴」就此形成。甚至我们可以认为,Grok-3 证明黎曼猜想的谣言,与其说是一场闹剧,不如说是整个 AI 行业的一面照妖镜:其一是折射出人们对 AI 的深层态度,大量技术乐观派坚信 AI 终将无所不能,既担心它发展得太快会失控,又害怕它发展得不够快无法实现突破。其二是自 GPT-4 问世以来,尽管 AI 领域不断有新产品涌现,却鲜有真正的突破性进展。人类既是 AI 的创造者,却又成了它最焦虑的观众。每一个 AI 谣言的背后,都藏着整个行业的焦虑与期待。加之最近闹得沸沸扬扬的 Scaling Law 发展撞墙论,相比去年的井喷期,今年的「创新疲劳」让人们对模型的小步改进已然失去耐心。在这个意义上,Grok-3 证明黎曼猜想的谣言也成了人们对未来的一次集体想象。哪怕作为普通用户,我们也越来越期待下一个从 GPT-3.5 到 GPT-4 的质变时刻。当然,真正的 AI 突破,往往发生在所有人都不看好的时候。但我们都希望这个谜底能在年底前揭开。koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:李书诚
TOP1热点:岳云鹏直播
发言人表示,香港国安法实施以来,香港居民依法享有的各项权利和自由在更加安全的环境下得到充分保障,但任何权利自由都不能突破国家安全底线。没有任何国家会对危害国家安全的行为坐视不理,执法必严、除恶务尽是各国维护国家安全的通行做法。反中乱港分子涉嫌煽动分裂国家、勾结外国或境外势力危害国家安全,警方对其关联人员采取必要的侦查和执法行动,依法依规、合情合理,无可指摘,不容置喙。。
雷蒙多是“70后”女性,经常梳着干练的偏分卷发,脸颊瘦长,神情略严肃。以往,她在推动对华贸易与对华进行技术遏制之间,实行“艰难的平衡”。其此行能否切实为中美经贸合作注入正能量,受到特别的关注。
TOP2热点:为什么很多家庭一到过年就吵架
近几年,医疗美容行业热度不减,医美不再只是“熟龄”人士的选择。根据医美平台新氧发布的《2022年医美行业白皮书》显示,2022年第一季度20岁以下的医美消费者占比达11.12%,出现医美消费年龄前置等新现象。未成年人进行医美有哪些风险,又该如何进行安全保障?
TOP3热点:2025 冲锋衣推荐rules 34 would undertale
在中美关系之外,美国智库观察中国的视角已从关注“疫情”话题逐渐回归常态化,特别是一些跟企业界和经济界关联比较密切的智库。美国企业研究所(AEI)和哈佛大学肯尼迪学院的研究者非常关注中国的经济发展情况、人口问题和与青年人有关的话题。他们还试图通过这些研究,对中国经济未来发展动力进行预测性讨论。
公开资料显示,雷蒙多属于民主党的温和派,在政治和金融领域均有丰富经验。赋予企业家创新能力,并帮助提高美国工人和企业的竞争力,是她商务部长任期内的主要使命。
TOP4热点:为什么春运期间不多安排绿皮车人脸替换脸杨幂
5)2005年1月23日,印花税再次下调,由2‰下调到1‰。调整后的1月24日,沪指收盘上涨1.73%。随后,A股引来波澜壮阔的一波三年的大牛市,上证指数在2007年10月达到历史高点6124点,至今仍未突破。
头几天,“高总”带着他四处闲逛,说是要认真地考察店面。从阿水所住的大楼往北走两三公里,就是臭名昭著的UK园区,往南是“不相上下”的环亚园区和KK园区,但那些似乎都不关他的事。
TOP5热点:LG 杯第三盘裁判未及时中断比赛合理吗Zoom动物人
“很多美国政客对中国持有敌对的态度,给中美关系增加了很多不确定性,并不利于双方关系的发展。而中方一直以来非常积极地推动中美关系朝着健康稳定的方向发展,希望能够和平共处,合作共赢。”美国泰和泰华盛顿律师事务所主任程绍铭说。
国家能源局新能源和可再生能源司副司长 王大鹏:实现绿证核发和交易的全覆盖,这样会极大提升绿证的供给量,绿电的消费需求能够得到有效满足。
TOP6热点:哪吒 2 预售破亿109ckcسكس
2020年4月,在辽宁大连务工的赵某找到了一份帮助规划设计师叶某拍摄城市风景照片的“兼职”,本以为是钱多活少的美差,结果对方布置的任务不断加码,要求其拍摄港口中停留军舰进行维护的照片。幸好赵某及早醒悟,才没犯下大错。
TOP7热点:幻云自曝网恋两个月被骗 20 万七夕节和牛郎织女有关系吗
河北此轮降雨200毫米以上笼罩面积5.36万平方公里,为1963年“63·8”洪水以来的最广范围。全省降雨量折合水量275亿立方米,降雨的最大点发生在邢台市临城县梁家庄村,累计降雨量达1008.5毫米。
自新一轮党和国家机构改革方案揭晓,中央社会工作部的组建就格外引发外界关注。前不久,中央社会工作部领导班子已经陆续公布,部长吴汉圣和副部长李文章、赵世堂、柳拯4位部领导相继在不同场合公开亮相。
TOP8热点:为什么中国农村房子那么丑幸福的一家动漫在线观看
参与解救的志愿者阿龙(化名)告诉环球人物记者,此次解救行动是在中国警方、中国驻缅甸大使馆、中国驻泰国大使馆等多方力量的积极推动下进行的,他也参与其中,前后大约花了一周的时间。细节他不便多谈,只能说“异常艰难”,不过,张川目前身体状况还不错。
TOP9热点:广厦男篮力克辽宁男篮buytake2挑战可以在哪看
未来LPR是否还会继续下行?董希淼认为,下一步,央行应适度下调政策利率,适时实施降准,继续为银行提供低成本资金;商业银行应用好存款利率市场化调整机制,有序降低存款利率,持续压降负债成本,继续推动LPR特别是5年期以上LPR下行,促进实体经济融资成本稳中有降,为促消费、稳投资、扩内需提供更好的支持和服务。
TOP10热点:为何机场需要 checkin 才能登机丝瓜ios苏州晶体公司ios免费
自新一轮党和国家机构改革方案揭晓,中央社会工作部的组建就格外引发外界关注。前不久,中央社会工作部领导班子已经陆续公布,部长吴汉圣和副部长李文章、赵世堂、柳拯4位部领导相继在不同场合公开亮相。