国精产品一区一区三区有限前国精产品一区一区三区有限百度研究院副院长新项目:给手机、PC做可用的大模型基础设施,前微软高管加入_ZAKER新闻
前国精产品一区一区三区有限百度研究院副院长新项目:给手机、PC做可用的大模型基础设施,前微软高管加入_ZAKER新闻
作为大运会的火炬手,郑睿认为“奋斗青春、放飞梦想”不仅是大运会火炬传递的主题,也是一代青年人的不懈追求。作为“成检智立方”团队的一名青年检察干警,深感使命在途、责任在肩。“在下一步工作中,我将坚持深耕主责主业,高质量办好每一个案件,用青春与奋斗书写成都检察人的新时代答卷。”
文|邓咏仪编辑|苏建勋《智能涌现》独家获悉,前百度研究院副院长李平的新创业公司 VecML,近期已经完成了产品的探索和初步研发。值得注意的是,VecML 近期还邀请到了前雅虎和 Ebay 首席科学家、前 Walmart 副总裁,和前微软技术高管 Jan Pedersen 博士,出任 VecML 首席战略官(CSO)。VecML 创始人李平博士,于 2007 年博士毕业于斯坦福大学,获得统计学博士学位,计算机科学硕士学位和电子工程硕士学位。博士毕业后,李平曾在康奈尔大学和罗格斯大学任教,并于 2013 年成为计算机系和统计系终身教授,并在 www.csrankings.org 的全球计算机大学和学者排名中名列前茅。△李平李平是完整经历了上一个 AI 1.0 时代,且在国内大厂完整经历了从 0 到 1 搭建 AI 团队的顶级技术专家。创业前,李平任微软(LinkedIn)公司的杰出科学家。加入微软之前,李平曾经是百度首席架构师(T11)和百度研究院副院长,并且直接管理百度认知计算实验室(Cognitive Computing Lab,CCL),落地成果包括超大规模深度学习 GPU 平台、多模态向量检索和生成、强化学习、知识图谱等生成式 AI 的核心技术。自 ChatGPT 推出后不到两年,如今生成式 AI 浪潮的关注焦点,已经迅速从基座大模型快进到 AI 应用落地。尽管生成式 AI 浪潮的发展速度,已经比历史上任何一个互联网浪潮都更快,但在今年,AI 界的共识并不十分牢固——对于 " 超级应用 " 的质疑、对 OpenAI 下一代大模型的疑问和不安,某种程度上,都是 AI 界和公众热切期待的映射。同时,这也体现出:生成式 AI 技术的落地,仍在相当早期的阶段。在 2024 年选择成立 VecML,就是李平对于 AI 应用落地难题的冲刺尝试。VecML 希望能够做下一代端侧 AI 的基础架构和边缘计算平台,让端侧的设备,也能完成更高难度的大模型计算。端侧,即手机、PC、家电等各类终端设备。如今市面上的 AI 大模型,即使是在手机上展示输出结果,但绝大多数的计算都通过云端进行。有分析数据显示,目前端侧 AI 只占整个 AI 市场 5% 的份额。原因在于,大模型的体量太大,而 PC 或手机的芯片,其计算和内存能力又太有限。这是 AI 应用落地当下的最大桎梏。对比普遍在数千亿至万亿参数的大模型,现在的手机端最多也只能运行量化后的 70 亿(7B)参数内的大模型,也就是说,纯靠端侧的算力,只能承载最简单的应用,如基础的文字对话、生图等等。如果想让 AI 应用真正走进大众的生活,现有的端侧 " 基础设施 " ——从端侧的电池、芯片等硬件,到软件侧的响应速度等等,达到 AI 应用能够爆发的阶段,还有很远距离。从年初成立新公司至今,VecML 已经推出了一套端侧 AI 基础架构和边缘计算平台。这可以看作是一个部署、开发端侧 AI 模型的 " 工具箱 ",企业客户通过这个平台,能够完成端侧 AI 的部署和运行。△ VecML 平台的主要组成部分:端侧大语言模型和优化平台;基于神经网络相似度的向量数据库和知识库;RAG 服务平台;安全和隐私保护平台;机器学习平台,包括联邦学习和分布式计算; 李平对《智能涌现》表示,VecML 团队均来自微软,百度,亚马逊等 IT 巨头或者顶尖大语言模型团队,在 AI 模型安全、隐私计算、大规模分布式计算、联邦学习、模型压缩和数据压缩等领域都有核心原创技术贡献。这是做好端侧 AI 的必要条件。在当前专攻的在端侧 AI 领域,团队也有多年的专业积累。比如,在 2017 年的 NeurIPS 上,李平的一项工作即证明了量化压缩的最优平衡点是 3-5 比特。而现在流行的端侧大模型,即是 4 比特和 3 比特模型。而比起大模型的参数、训练工程之巨大,端侧的核心开发难点,可以说是要怎么在极小的模型和极小的内存空间上精细雕刻。" 比如,手机上的模型只有云端模型百分之一的参数、和千分之一的上下文长度(即每次和模型交互,单次输入的文本长度)。如果要做好 RAG 功能,在云端大模型上,如果不计成本,只要直接扔文件进去就好,但在手机上大模型需要在文件中,精准找到直接相关的文件部分,加起来不能超过数百 token,再放进提示词中。" 李平对《智能涌现》解释。△基于 VecML 开发的,可以运行在 Android 手机上的 APP,不需联网当前,基于 VecML 开发的手机端大模型应用,已上线了包括本地视频 / 图像搜索、智能本地文件搜索等等功能,调用速度也显著快于基于云端的大模型。如果 AI 可以全部或部分在端侧完成,这意味着什么?首先,企业在云计算上的开销就基本没有了,对企业成本和社会成本的节省将有巨大意义。另外,因为用户数据的存储和计算都在本地,AI 大模型涉及的隐私问题会得以有效解决——就在前不久,苹果 AI 的隐私隐患就被马斯克猛烈抨击。而在 8 月,荷兰数据保护局(DPA)在其官网宣布对优步 ( Uber ) ,因为其把欧洲用户隐私数据传回美国,处以 2.9 亿欧元的罚款。这也会很有效地提升算力利用效率。分布式计算天然和端侧 AI 紧密相关。数量巨大的端侧设备可以联合起来一起训练或者推理,真正把端侧算力充分利用起来。有效的分布式计算需要解决非常多的技术难题,包括隐私保护,数据压缩,高效数据传输,高效优化算法等。VecML 所在的 AI Infra 赛道,是链接算力和应用的中间层基础设施。在基座模型仍在快速迭代时,其 " 承上启下 " 的地位更加重要——如何充分挖掘现有模型的潜力,决定着 AI 应用能够走多远、多深。对模型前沿技术的突破,就至关重要。谈及 VecML 的优势,李平表示,当前公司已积累的多项原创技术,可让端侧 AI 的计算效率大大提升。比如,手机上存储的数据很多都为非结构化数据,需要通过建立向量关系,来让 AI 可以准确搜索到这些数据。目前,业界在手机上使用的向量数通常不超过 20 万,但通过 VecML 的原创方案,可以在降低内存 10 倍的前提下,也不影响 AI 搜索速度,这意味着手机上可以建立上千万向量的数据库。另外,在隐私保护层面,两种主流技术路线包括多方计算和差分隐私,但都有其局限。其基于加密解密的多方计算速度太慢,远不能满足实用需求;而基于差分隐私算法因为对精度损失太大极少被工业界采用。当前,VecML 的原创隐私保护技术,已经可以在基本上不影响精度的前提下,达到数学上严格的隐私保护要求。近期加入 VecML 的 Jan Pedersen 博士,是一位 AI 界老兵。他在 1998 年就在搜索先驱公司 InfoSeek 任总监,和如今的百度 CEO 李彦宏曾经是同事。Jan Pedersen 曾于 AltaVista、雅虎和亚马逊担任过首席科学家职位,而后加入微软。2016 年,他被任命为微软集团的 Technical Fellow,当年这是在全球仅有 20 位的高管。△ Jan Pedersen 博士据 Bessemer 2024 年的 AI Infra 报告,生成式 AI 浪潮来临后,数据数量,尤其是非结构化数据,到 2030 年预计将激增至 612 ZB,这将逼近现有基础设施的极限,也在倒逼其进行更新。因此,从 2023 年开始,AI Infra 的创业热度大大提升,从 AI 训练、框架、观测、部署、评估等等环节,都有不少公司入局,开发相应的基础设施平台产品。这个赛道接下来或许要迎来一场加速战。如今,全球手机、PC 厂商都把 AI 作为发展重点,端侧 AI 是他们不能允许自己错过的下一代入口。而就在这个 9 月,苹果正式发布第一台 AI 手机 iPhone 16,也又一次把大众对端侧 AI(Edge AI)的关注,推向新高峰。封面来源|视觉中国koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:刘长胜
TOP1热点:减持药明康德、加仓海思科,中欧基金葛兰:一季度继续看好创新药械及其产业链
二、本区风雨影响。
TOP2热点:叶永青终于就抄袭公开道歉,赔偿西尔万500万元
一、强化荣誉激励。民兵和专职人民武装干部是提高社会组织动员力、维护国家安全稳定的重要力量,近年来在稳边固防、新冠肺炎疫情防控、抢险救灾等急难险重任务中发挥了生力军作用。为基干民兵和专职人民武装干部列装配发21式作训服,有利于激发广大民兵和专职人民武装干部的荣誉感责任感,有利于凝聚起全社会支持国防建设和后备力量发展的磅礴动力。
7月27日下午,上海长海医院召开科普工作会议暨“深蓝”健康科普基地成立仪式。本文图片均由澎湃新闻记者张呈君图
TOP3热点:柯洁决胜盘抗议未果退赛,韩国棋手LG杯零胜夺冠1819岁MACBOOK日本
服务流程方面,医院推出一系列保障举措,让特殊人群就医更安心。针对听语障碍、视力障碍、行动不便、使用方言或外国语等特殊患者,开通就医绿色通道,实现专人专管,在门诊-病房-手术室(产房)等就医场景变换时,主管医护人员“无缝”交接。
TOP4热点:女子驾车遭追尾目睹丈夫、儿子、保姆丧生,肇事货车多个制动器有安全隐患202.GGY.钙站
乒乓球是赵巷镇体育“一镇一品”项目,崧泽学校作为上海市青浦区乒乓球训练基地,多年来一直致力于推动乒乓球项目发展。“崧泽杯”全国青少年乒乓球精英邀请赛已举办十二届,在上海市乒乓球协会、市乒羽中心以及青浦区体育局、教育局、上海市慈善基金会青浦代表处等部门支持下,逐渐成为具有一定影响力的全国性青少年乒乓球赛事。在普及和发展乒乓球项目的同时,也为青浦培养和输送了一批优秀乒乓球体育后备人才。
受台风影响区域的驾驶人非必要不出行,遵守相关的交通管制措施。
TOP5热点:只讲三点|中美间又有重要通话,王毅送给鲁比奥四个字暴躁CSGO妹子
很大的客观原因在于,现在对房地产市场的担忧已经不是涨得过快,而是把防风险放在首位。这也意味着,接下来对于房地产市场将采用鼓励发展的方法。
TOP6热点:不参加LG杯颁奖仪式,柯洁退赛后简介改为世界围棋九冠王ZOOM与人性ZOOM2区别
像击鼓传花般轻轻地传递
TOP7热点:国台办:台湾居民有选择来大陆定居落户的自由和权利YOUJAZZY MINDE
服务流程方面,医院推出一系列保障举措,让特殊人群就医更安心。针对听语障碍、视力障碍、行动不便、使用方言或外国语等特殊患者,开通就医绿色通道,实现专人专管,在门诊-病房-手术室(产房)等就医场景变换时,主管医护人员“无缝”交接。
TOP8热点:习近平在辽宁沈阳市考察调研国精一二二产品无人区价格
节目还创新设置了“中轴时空列车”的形式,在浓缩时空坐标的同时,放大了中轴线的辐射范围,拓展了中轴线的表意空间。嘉宾们坐着这趟列车穿梭于从元代到现代中轴线上的任意地点。每次“时空穿越”都会邀请那个时代的历史人物上车,通过他们的讲述解锁一段历史故事。这种以“综艺+影视”形式转场的设置精巧而不显突兀,使深远历史与现实时空有机交融,赋予了中轴线极强的艺术生命力。比如,嘉宾先随着“中轴时空列车”来到700多年前的元大都,了解“中轴线1.0版”的模样,然后又带着问题穿越回现代,学习中轴线最初的地理测绘方法,参与“辨方正位”测定中轴线的还原实验。当沙盘中的圆圈与“中轴线”形成了甲骨文形态的“中”字时,“中轴丈量人”单霁翔感慨道,“我们的古人通过太阳,知道了时间与空间的关系,找到了一年的春夏秋冬、二十四节气,找到了‘中’字,也就找到了中国人的根”。如此讲述,观众对蕴藏于中轴线里的中国人的哲学和宇宙观形成了直观且深刻的感悟。
TOP9热点:293元8个菜的预制年夜饭火爆销售,没有国标仍是主要问题Q14MAY18_XXXXXL56ENDIAN
二、本区风雨影响
TOP10热点:韩国为何规定“死子”放入棋盒盖?再谈柯洁LG杯犯规判负刻晴大战史莱姆隐藏网站
格鲁什声称,美国政府可能自20世纪30年代以来一直关注着“非人类”的活动,他们不仅找到了“地外飞行器”,还拥有据称为“非人类飞行员”的遗骸。尽管并不掌握第一手资料,但格鲁什表示可以提供一份名单,名单上的证人可向国会提供更多UFO相关事件的信息。