沈阳老阿姨最后的巅峰双双夺冠!盛大旗下AI模型分别问鼎BFCL与OpenLLM榜首_ZAKER新闻沈阳老阿姨最后的巅峰
双双夺冠!盛大旗下AI模型分别问鼎BFCL与OpenLLM榜首_ZAKER新闻沈阳老阿姨最后的巅峰
4月7日,教育部和中央党校(国家行政学院)分别召开学习贯彻习近平新时代中国特色社会主义思想主题教育动员部署会议,胡文容均以中央第二十三指导组组长的身份出席并讲话。
近日,由盛大 AI 团队研发的模型(Watt-tool-70B 和 Newsbang/homer-72B)力压包括 OpenAI、谷歌、Meta、阿里等顶尖机构提交的模型,双双登上国际知名的 AI 排行榜榜首。Watt-tool-70B 是由盛大旗下 Watt 团队研发的旗舰模型,目前位列 BFCL Leaderboard 总榜单第一,其提交的 8B 小模型也排到榜单第四。BFCL(Berkeley Function-Calling Leaderboard)是由加州大学伯克利分校开发的评估 LLM 工具调用能力的基准测试平台。工具调用(Function-Calling)是目前大语言模型(LLM)最热门的研究方向之一,让 LLM 理解、并能够准确使用 API,来执行更复杂而具体的任务。该榜单近一年来长期被 OpenAI 的 GPT 系列模型霸榜,在近期公布的最新一轮评估结果中,Watt 的 " 多轮对话执行能力 " 有着非常显著的领先,相较于排名第二的 GPT-4o 领先了 11 分,和排名第十的 Gemini-1.5-Pro 相比则领先了将近 40 分。除了在常见的 COT(思维链)和 SFT(监督微调)下工夫,Watt 还有两个核心攻关方向:1. 应用了专为多轮代理任务设计的 DMPO(Direct Multi-Turn Preference Optimization) 技术,让大模型在复杂执行过程中保证选择正确和交互正确。2. 基于自研的 AI 研发效能平台鲁班 Lupan Platform 来实现快速大批量的 API 接入,大幅强化了工程上的后勤能力,全方面使用 LLM 对更深层的效能建设做升级。" 这个模型架起了 SaaS 时代与 AI 时代的桥梁,加速大模型落地的 " 融合 " 过程。"Watt 负责人表示," 这是从底层数据标注到人机交互的的体系化建设,让大模型实现从‘光说不练’到‘能文能武’的初步落地。"由盛大 NewsBang 团队开发的 Newsbang/homer-72B 模型则在 OpenLLM LeaderBoard v2 榜单上,在 72B 参数规模的模型中力压众多知名开源模型(包括阿里的 Qwen/Qwen2.5-72B-Instruct,Meta 的 meta-llama/Meta-Llama-3.1-70B-Instruct,以及众多开源社区的改进模型),位列第一。Open LLM Leaderboard V2 是由 Hugging Face 维护的开源语言模型评测平台的升级版本,它采用更全面和严格的评估标准,对各类开源大语言模型进行多维度测试和排名。该平台特别关注模型在实际应用场景中的表现,包括推理能力、数学运算、代码生成等多个关键领域,是评测开源模型使用最广泛、最重要的 benchmark 之一。Newsbang/homer-72B 的训练全程深度融合前沿的数据合成技术,尤其重视提升模型在推理和思考方面的能力。团队打造了大规模的推理性与指令性数据集,搭配严苛的数据筛选机制,基于优质的开源 Qwen2.5-72B Base Model 重新进行了 posttraining,让模型在多个核心评测维度(MMLU-Pro、IFEval、MATH、BBH)有大幅的性能提升。Homer-72B 的训练过程中,采用了两阶段的推理数据构造策略:1)在第一阶段,基于大量开源的数学、代码和综合型数据集,通过一个精心设计的 ThinkingAgent 来对原数据进行扩充,得到扩充后包含思维链的数据集。之后采用了 APO 的方式对数据进行进一步的精炼,得到 CoT_Refine 数据集。为了保证模型的通用性能和 instructionfollowing 能力,我们采取了 Mix 策略对原始数据集和 CoT_Refine 数据集进行混合,并完成了 SFT 训练。2)第二阶段,则基于 CoT_Refine 数据集进行了 pairwise 的正负样本数据构造,并通过 RewardModel 对数据进行筛选,筛选出置信度最高的数据,在 SFT 的模型上进一步进行了 DPO 训练。根据公开信息,盛大集团创始人陈天桥自 2023 年初宣布 All in AI 战略以来,一直以新锐姿态进军 AI 赛道,并为内部孵化的 AI 企业提供 "50% 的利润直接分配给员工,另外 50% 持续投入研发 " 的突破性激励政策。去年 10 月,盛大联合多家顶尖高校发表了 AI 与长期记忆论文,其自研的 OMNE 大模型多智能体框架登上 GAIA 基准测试排行榜榜首。去年以来,陈天桥创办的天桥脑科学研究院与《Science》杂志合作推出了全球 AI 驱动科学大奖,并举办和支持了包括 "AI+ 精神健康 " 在内的各种高水平国际会议和夏校项目,致力于培养跨学科的青年 AI 人才,并持续欢迎优秀 AI 人才加盟。koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:朱希
TOP1热点:老鼠舞
马秀兰此前任临夏州委常委、东乡县委书记,近日已出任武威市委副书记,她曾荣获“全国脱贫攻坚先进个人”“全国优秀县委书记”等称号。。
北大国民经济研究中心报告认为,2023年自然走势下的CPI同比增速中枢较2022年将会继续小幅上移,大概率呈现先高后低随后平稳的走势,预计2023年全年CPI同比增速约为2.5%。(中新经纬APP)
TOP2热点:现在很多笨小孩
专家们普遍表示支持扩军。其中北京体育大学中国体育政策研究院执行院长鲍明晓认为,CBA短期扩军需要慎重,中长期扩军是大势所趋,但要找好时机和时间节点。
TOP3热点:bro先别回女朋友消息了,来看盔甲对决山东浩浩与大猛12022合作
有数据显示,2016年上半年,上海制造业增加值占GDP比重仅为26%,同年,上海给制造业划下一道红线:制造业增加值不低于GDP的25%。
根据日方统计,从7日到9日期间,山东舰舰载战斗机起降约80架次、舰载直升机约40架次。对于首次出远海展开训练的航母而言,这样的出动效率已经相当惊人了。
TOP4热点:【规则怪谈·恐怖游乐园】诡谲惊悚!我们将在3天内于废弃游乐园搜集线索,找寻一线生机,我们能顺利逃离吗??!海角乱伦
对于本轮中小银行下调存款利率,业内人士认为,是对2022年9月存款利率下调的延续。部分中小银行今年“开门红”期间阶段性上调了存款利率,现在只是将利率进行回调。
国家统计局数据显示,2月,全国CPI环比下降0.5%,同比上涨1.0%。CPI同比增速上行,重回“1时代”,明显低于市场预期。
TOP5热点:开学了老公看我和别人发的关系
不过让老司机好奇的是,就在山东舰航母编队抵近台湾东部海域,从根本上完成了在台岛周围形成密不透风的“封控闭环”之际,几天前被台湾某些人看作是“救命稻草”的美国“尼米兹”号航母打击群在哪里?
2007年,广东省人口首次超过河南省,成为全国第一人口大省,这一地位已维持了15年。2022年,山东省常住人口为10162.79,比广东省少2000多万。河南省则以9883万人,位居全国第三。
TOP6热点:凌晨3点“热心邻居”闯入了你的家中,屏住呼吸!别被发现!真实案件改编!FuCK激情
此外,东北三省和京津冀地区常住人口在2022年都出现减少。辽宁省常住人口减少最多,为32.4万。而东北三省2022年常住人口总共减少86.08万。
在日前举办的“2023全球经济信心指数”调查报告发布会上,国务院发展研究中心产业经济研究部副部长许召元向中国新闻周刊表示,扩大消费是当前政策的重点,调查中受访者认为,消费复苏面临着多个挑战。
TOP7热点:客户:合着你迟到就是干这个去了?俄罗斯SEVERODVINSK
介文汲提到,现在中国大陆的卫星监测系统对水面上军舰等的一举一动全都掌握,“所以就有一个说法,当时为什么美军一直往后撤,而且尽量避免‘我可能要干涉’的嫌疑,因为中国大陆公布了美国两艘航母编队的整个精确位置图,也就是说,你在哪里,我很清楚,美国一看,发现‘没错,我就在这里’。也就是说,导弹系统可能随时来攻击,你拦截不住的话,你整个舰队可能就被摧毁了。所以,这就是美国如果干预可能要付出的代价”。
文章还指出,能源领域相对集中的能源审批权和国有企业的垄断经营权,很容易成为想要进入或涉足能源行业的企业或个人公关的对象,导致能源领域成为权力寻租的重灾区。
TOP8热点:【蛋仔自习室117】超燃竞技场一周年 全英雄强度梯度排行!谁是当下三体人?(中)打开扇贝就可以吃火腿肠
武威市政府官网介绍,武威位于甘肃省中部、河西走廊东端,是中国旅游标志——马踏飞燕的出土地。1986年被国务院命名为全国历史文化名城和对外开放城市,2001年5月经国务院批准撤地设市,2005年被命名为中国优秀旅游城市,2012年10月被命名为中国葡萄酒城。现辖凉州区、民勤县、古浪县和天祝藏族自治县,总面积3.23万平方公里,有9个乡、84个镇、9个街道办事处、1054个行政村。2021年末常住人口144.33万人,其中,城镇人口69.6万人,乡村人口74.73万人,聚居着汉、藏、回、蒙等41个民族。
但两周后,张雄在中国篮球媒体日上的言论又变得谨慎,趋向于保守:“如果在思想还未统一、共识尚未形成的情况下,仓促扩军肯定会出现问题。”
TOP9热点:当蛋仔无敌甜心蛋玩蛋仔派对,挑战代一千位宝宝蛋上无敌凤凰段位粉色苏州晶体
另外,管理和监督机制存有漏洞,审批权运转不透明,缺乏有效的内外部监督机制。而也正因为这些漏洞,互相制衡的双方或多方权力主体容易产生共谋和非法协作倾向,形成窝案串案。
文章还指出,能源领域相对集中的能源审批权和国有企业的垄断经营权,很容易成为想要进入或涉足能源行业的企业或个人公关的对象,导致能源领域成为权力寻租的重灾区。
TOP10热点:全世界唯一随便乱扔都不会直接坠地的纸飞机,你学会了吗?老公看我和别人发的关系
“如果国有企业利用其与政府之间的联系谋求优先竞争地位,那么其就极有可能通过市场垄断、价格差、政府补贴等方法确保自身的高利润水平。这可以理解为垄断领域的政策资源。而这种资源容易导致国家利益部门化、部门利益个人化,成为滋生腐败的温床。”上文指出。