体育新动-"性训练营"-大模型上车有多难?_ZAKER新闻性训练营

性训练营大模型上车有多难?_ZAKER新闻性训练营

性训练营大模型上车有多难?_ZAKER新闻性训练营

大模型上车有多难?_ZAKER新闻性训练营

  1月12日早上7点多,“天安煤业十二矿”的矿工记平像往常一样下到煤矿施工区,随身携带着妻子为他做的饭菜,因为井下作业要持续8个小时。

" 卡脖子 "日前,中国电动汽车百人会发布调研报告《全球及我国新能源汽车产业发展趋势与政策走向》。报告指出,探索大模型在汽车领域的应用仍面临诸多挑战,并给出了相应建议。01 挑战目前,国内企业面临训练芯片 " 卡脖子 " 问题。大模型云端训练需要上万片高端 GPU 训练芯片,尤其是端到端自动驾驶训练数据量已达到 PB 级,训练芯片需求更大。特斯拉端到端自动驾驶 FSD V12 在超过 10 万块 GPU 芯片支撑下才实现周级迭代。国内多数车企仅有上千块 GPU,很难发挥海量数据价值并实现较好的训练效果。大模型在云端提供服务也需要大量算力支撑,以 ChatGPT 为例,按照每天独立访问量 2500 万次计算,预计需要 3 万多片 A100 芯片。目前,美国对华禁售 A100、H100 高性能 GPU 芯片,甚至也限制出售 " 阉割 " 版的 A800、H800。同时,国产芯片仍存在制程落后、性能不足等问题,部分芯片在大规模训练时故障率较高,使用体验仍有欠缺,导致我国车企的算力扩展遇到很大阻力。国内大模型训练数据量少且质量不高数量方面,据 Epoch AI 估算,全球用于训练通用大模型的数据中,书籍、科研论文等高质量语言数据集可能会在 2024 年前耗尽,大模型训练或将面临无数据可用的窘境。中文语料数据仅占约 1.3%,Common Crawl、BooksCorpus、WiKi pedia、ROOT 等主流数据集都以英文为主,即使是最流行的 Common Crawl 数据集,中文数据也只占 4.8%。另外,大模型理解和掌握客观世界规律,需要学习大量来自知识和价值观层的数据,此类中文语料短缺严重,甚至无法通过机器翻译进行弥补。聚焦自动驾驶领域,特斯拉拥有超过 1000 万个有效视频片段数据,且其在全球有超过 600 万辆智能汽车在通过影子模式持续采集数据,平均每辆车一天就能搜集到一个典型的极端工况样本。与之相比,国内车企场景数据普遍不足百万,且出于数据合规的考虑,车企之间数据的共享流通仍有阻塞,导致国内车企的高价值场景数据较特斯拉相差超过一个数量级。质量方面,高质量数据集,需要企业在数据治理方面投入巨大的资金和精力,包括顶层设计、标注规范、标注质量把控以及发布后更新升级等各个方面,但国内企业在数据挖掘和数据治理领域的积累和沉淀不足。汽车行业属于传统制造业,数据的沉淀更是差强人意。这使得大模型在汽车行业落地应用过程中,存在明显的训练数据分布不均衡及完备性较差等问题。例如,国内车企的绝大部分数据分布在几个密集的场景里," 头部效应 " 非常明显,真正需要的极端工况数据却非常少。且国内车企车型多而单一车型存量少,不同车型的传感器功能不一样,采集的数据各有差异。与特斯拉车型相对集中且传感器方案比较统一相比,国内车企数据的复用性很差。数据问题不解决,大模型可能会形成 " 偏科 ",导致产生严重的 " 幻觉 " 问题,由于汽车行业本身对安全性和可靠性的要求极高,这也会大大限制大模型的应用落地。落地商业模式不清晰一方面,大模型处于发展初期,主要以 Token 使用量收费。从 TO B 模式来看,车企每年的预算、成本、营收是固定的,以 Token 使用量来收费的模式动态性太大,车企难以接受。另一方面," 软件 + 服务 " 的模式,在国内很难得到认可。在汽车行业 " 内卷 " 越来越严重的当下,纯 license 模式也难以持续,企业付费意愿不高。此外,大模型商业化的价值,还是以提升车企产品销量的传统方式为主,车企、大模型企业双方还未找到可以合作共赢的路径。缺乏良性合作生态支撑。一是贯穿实时信息以及垂类信息的数据生态还未形成,导致大模型对实时动态和垂直领域的理解能力比较差。例如,GPT-3.5 训练数据集截止到 2021 年,无法理解和处理 2022 年的信息。二是大模型上车会对整车软件架构、硬件能力、交互策略产生很大影响。目前国内大模型产品非常多且迭代速度非常快,如何在保证产品竞争力的前提下与大模型企业合作,车企仍存疑惑。三是开源大模型没有一个是由中国完全主导的,势必会影响国内 AI 技术的迭代速度与创新能力。在全球化竞争日益激烈的背景下,没有主导的开源大模型,可能使中国 AI 企业在国际市场上处于不利地位。缺乏大模型能力评价标准。行业和消费者对大模型上车的期望都很高,但对其表现的诉求 " 千人千面 "。有些人希望大模型无所不能,对所有的问题都能答复。有些人希望简洁,只要按照指令操作即可。如何评价大模型在具体场景下的能力,仍然没有明确、统一的标准。例如,当前大模型在语音交互的语言理解、逻辑推理、信息归纳等能力方面,已经有很多评价指标,但是在上车评价方面,仍面临识别准确率的评判局限、响应速度评价单一、用户体验受主观性和复杂性拘束、缺乏多场景综合评估等挑战。02 建议加强大模型对汽车行业颠覆性影响的认识。汽车行业的根本是制造业,大模型创新发展的速度远远超出了汽车产业,两个产业融合会对汽车产业产生深刻甚至颠覆性的影响。汽车行业需要从战略上刷新认知,顺应技术发展趋势,加快拥抱和接纳大模型的速度,充分利用大模型加快汽车产业智能化发展的步伐。建立适应大模型发展的管理机制。智能汽车的快速发展是多部门共同推进的结果,大模型在汽车行业的落地应用是一个系统性工程,需要算力、算法、信息传输等多层面能力的共同支持,更需要政府部门统筹推进,建立一个适应大模型发展的管理机制。在技术相对落后的情况下,发挥我国多系统协同的能力和优势,从而探索出差异化的发展道路。加强试点示范。目前,国内通过备案的大模型达 117 个,但真正实现商业变现的很少,关键是没有找到核心的应用场景。建议选择具有代表性的车企和大模型企业,开展试点示范项目,通过应用驱动的方式,探索大模型在汽车领域的高价值应用场景,形成可复制、可推广的经验模式,促进大模型的可持续健康发展。加快推动算力共享。以美国为代表的发达国家的 AI 和芯片,已经形成软硬件相互促进的合力。为弥补算力短板,建议政府部门和行业机构推动建立算力联盟,把部分公共属性的算力统筹起来。或者鼓励企业揭榜挂帅,将国内各公司分散的算力集中起来,推动算力资源共享,解决 AI 基建不足的问题。促进汽车数据共享与流通。一方面,加快制定汽车数据定价、权责划分、流通交易等基础制度,消除相关法规壁垒,促进汽车数据大规模流通,增加可供大模型训练的数据量。另一方面,借鉴北京市政府开放市区级单位高质量政务数据的做法,在合法、保证隐私的前提下逐步放开部委、地方政府的政务数据并积极引导行业机构释放部分高质量数据,形成通用型数据集并对外公开,比如地理信息涉密等级、AI 内容生成涉及的道德、伦理、法规等相关信息。此外,加大对数据合成、仿真数据方面的支持力度,适当鼓励并推动合成数据的应用,弥补国内车企数据不足的短板。构建开放性合作生态。发挥好车企的链主角色,推动形成面向全行业的开放平台。车企把握数据入口,供应商提供算法、算力,共同打造能力共享、灵活组合的开放性生态,协同推动汽车行业大模型的发展。加快建立大模型上车与评价标准体系。在行业机构的牵头下,根据差异化落地场景,分步骤推动大模型上车评价标准和宣传体系的建立。可优先推动进展较快的人机交互等应用场景。本文来自微信公众号 " 车百智库 ",作者:车百智库。

koa12jJid0DL9adK+CJ1DK2K393LKASDad

编辑:张志远

TOP1热点:电竞选手再失踪 曾称网恋被骗20万

  中国足协1月5日发布了第一批完成债务清欠的俱乐部公示名单,三级联赛共42家俱乐部进入首批名单,其中新赛季16家中超俱乐部全部在内。未进入名单的俱乐部为中甲三家(广州、大连人、深圳),中乙五家(北理工、南通海门珂缔缘、武汉江城、海南之星和泉州亚新)。。

  毛宁表示,中方已经第一时间向新方提出严正交涉。新加坡领导人曾多次表示,台湾问题是中国红线中的深红线。中方重视新方这一说法,希望新方严格恪守一个中国原则,以实际行动维护中新友好关系大局。

TOP2热点:洪晃:最有意思的年俗是穿新衣

  检察机关加大查办司法工作人员相关职务犯罪力度,坚持加大力度、务必搞准。最高检直接立案侦查西藏自治区公安厅原常务副厅长杨光明涉嫌徇私枉法案。

  此前,北京师范大学法学院教授彭新林曾对媒体表示,最高检对各省级检察机关有领导职责,在必要时,有权对一些案件直接提级办理,这些案件可能是案情重大、复杂的,也可能是涉案人员身份特殊、办理难度大的。此外,若当地检察机关认为案情重大、复杂时,也可以请求将案件移送最高检侦查。

TOP3热点:男子提前回家给老旧房子贴春联人与动物PPT免费模板大全

  大皖新闻讯“平时头上的灯能照30米远,事故发生时一米外的东西都照不见。”今年是记平在矿上干活的第14个年头,这是他头一次遇到煤与瓦斯突出事故,说起事发时的情形他仍心有余悸,躺在医院病房里的这两天他没能睡成一个囫囵觉。

  按照彭博社的报道,已经发现至少5艘船只,以这种方式通过或准备通过红海。两艘已经驶离红海,向亚洲方向进发;两艘正在红海航行,迄今没遇到问题;还有一艘正在印度附近,正向红海方向航行。

TOP4热点:女子半夜上旱厕摔跤 婆婆用棉絮铺路WWW.1166.COM

  中国足协1月5日发布了第一批完成债务清欠的俱乐部公示名单,三级联赛共42家俱乐部进入首批名单,其中新赛季16家中超俱乐部全部在内。未进入名单的俱乐部为中甲三家(广州、大连人、深圳),中乙五家(北理工、南通海门珂缔缘、武汉江城、海南之星和泉州亚新)。

  #瑙鲁与台湾断交#瑙鲁政府当地时间15日发布声明,宣布承认一个中国原则,与台湾当局断绝所谓“外交关系”。 声明指出,瑙鲁政府按照联合国2758号决议,承认中华人民共和国政府是代表全中国的唯一合法政府,台湾是中国领土不可分割的一部分。瑙鲁即日起断绝与台湾的“外交关系”,不再同台湾发生任何官方关系,不进行任何官方往来。

TOP5热点:雨天狗被困黑洞 男孩忍臭救出4只总裁情深不浅

  公开资料显示,胡海峰曾任清华控股有限公司高级工程师、同方威视技术股份有限公司总裁。2005年9月任中华全国青年联合会第十届委员会委员。2010年4月,胡海峰任浙江清华长三角研究院党委委员、书记 。2013年5月,胡海峰履新嘉兴市委副书记,2014年3月任嘉兴市委政法委书记。2016年3月,44岁的胡海峰主政一方,出任嘉兴市市长,成为正厅级干部。

  1993年6月,杨光明成为波密县副县长,3年后成为林芝地区公安处副处长、正县级侦察员,之后历任林芝地区公安处处长,林芝地区公安处党委书记、处长等。

TOP6热点:赵雅芝叶童 春晚最后一次彩排金银瓶1-5

  据《检察日报》报道,杨光明先后担任西藏自治区公安厅党委副书记、常务副厅长等职务,任职期间多次利用职务便利徇私枉法。受案后,最高检组成专案组赴西藏、四川等地,完成侦查取证任务。

  另外,从增减幅来看,天津、上海、广西、浙江、广东、北京、海南等7省份12月CPI数据较11月回落,上月回落省份则达到30个。

TOP7热点:#暴雪下的春运回家路有多艰辛#无遮挡BBBBB级A片

  此外,征求意见稿提出,不具备拆除新建条件的,纳入整治提升(含拆整结合)类城中村改造范围,开展经常性整治提升,按照文明城市标准实施和管理。在维持现状建设格局基本不变的前提下,为完善城市基础设施、公共服务设施,消除安全隐患,可按照规划采取“整治提升+局部拆建”方式实施拆整结合类改造;局部拆建应以栋为基本单位,涉及的拆除用地面积之和(含零星纳入的空地)原则上不超过拆整结合类城中村改造项目总用地面积的30%。

  社论还说,赖清德台南本命区88枪击案至今黑影幢幢,更遑论“光电”“炉渣”利益纠葛、议长选举买票案等,地方戏称“台南市变哥谭市”(美国漫画中的虚构城市,以腐败、贫困、虫害、污染和犯罪而闻名——本网注)。

TOP8热点:女子高铁霸座 被行拘5日金银瓶1-5

  因此,宋丁指出,“城中村改造+房票安置+PSL低息贷款”三大政策组合在一起,是我国倡导的房地产新发展模式的一个重要表现,新发展方式就是由过去外延式向内涵式高质量发展,如果能在全国普遍推开,对今年房地产发展具有非常大的正面影响。

  毛宁强调,我们敦促美方务必认清台湾问题的极端复杂性和敏感性,切实恪守一个中国原则和中美三个联合公报,将美国领导人多次重申的不支持“台独”、不支持“两个中国”或“一中一台”、不寻求把台湾问题作为工具遏制中国等承诺落到实处,慎之又慎处理涉台问题,不以任何形式虚化掏空一个中国原则,不向“台独”分裂势力发出任何错误信号。

TOP9热点:欧盟军事高官:欧盟应在格陵兰岛驻军成免费crm

  她指出,世界上只有一个中国,台湾是中国领土不可分割的一部分,中华人民共和国政府是代表全中国的唯一合法政府。这已为联合国大会2758号决议所确认,是国际社会普遍共识。在一个中国原则基础上,中国已同全世界182个国家建立外交关系。瑙鲁政府决定同中国复交,再次充分说明,一个中国原则是人心所向,大势所趋。

  此次调价后,消费者用油成本小幅降低。以油箱容量50L的普通私家车计算,车主加满一箱92号油将少花2元左右;对满载50吨的大型物流运输车辆而言,平均每行驶100公里,燃油费用减少1.6元左右。

TOP10热点:开新能源车返乡 3个服务区才充上电公媳合集

  广州市出台房票政策,进一步拓宽了拆迁安置渠道,满足了人民群众对房屋安置的多样化需求,为其他超大特大城市推进城中村改造提供借鉴。目前,首批“定点入库”名录包括荔湾发展集团、中海集团、珠江实业、力诚投资公司等。随着房票政策的正式实行,未来政府收储、统筹做地和“三旧”改造等不同模式的城中村改造项目的推进速度均有望加快。

  卓创成品油分析师高青翠表示,由于沙特阿拉伯大幅度下调2月原油官方销售价,且美国石油库存增加,引发市场对供应过剩和需求疲软的担忧,国际油价冲高回落;另一方面,中东地缘紧张局势持续扰动市场,市场对供应终端存担忧情绪,对国际油价形成底部支撑。

发布于:莫力达瓦达斡尔族自治旗