好•色•先•色丅V2GB 内存就能跑 ChatGPT!这个国产「小钢炮」,要让华为 OV 们的 AI 体验突破好•色•先•色丅V瓶颈_ZAKER新闻
2GB 内存就能跑 ChatGPT!这个国产「小钢炮」,要让华为 OV 们的 AI 体验突破好•色•先•色丅V瓶颈_ZAKER新闻
2023年1月19日,阿德恩突然宣布辞去总理一职,希普金斯接任上台。那时他就强调,访华是他的“优先工作之一”。“如期访华说明希普金斯自己也对此行充满期待。” 中国现代国际关系研究院东南亚和大洋洲所助理研究员孙畅向《环球人物》记者分析。
在这波 AI 浪潮中,面壁智能是国内少有选择 All In 端侧模型的头部大模型厂商。自从面壁智能 2 月份发布性能小钢炮 1.0 后,接连几月陆续迭代升级,其中后续推出的开源模型 MiniCPM-Llama3-V 2.5 更是因为强悍的实力遭到了斯坦福 AI 团队的抄袭。四月份,面壁智能 CTO 曾国洋还曾预言,GPT-3.5 级别的模型将在一两年内就能在移动设备上运行。好消息是,不用再等一到两年了,因为今天发布的 MiniCPM 3.0 实现了初代小钢炮发布时立下的 Flag:今年内让 GPT-3.5 水平的模型在端侧跑起来。仅 4B 参数,以小博大,性能超越 GPT-3.5,MiniCPM 3.0 也标志着「端侧 ChatGPT」时刻的到来。简单来说就是,MiniCPM 3.0 的面世意味着用户未来能体验到快速、安全、且功能丰富的本地 AI 服务,无需依赖云端处理,以及获得更流畅、更私密的智能交互体验。从官方分享的基准测试来看,MiniCPM 3.0 在 CMMLU、CEVAL 等考究中文能力的基准测试中一骑绝尘,轻松碾压 Phi-3.5、以及 GPT-3.5 等模型。而即便是对上了 8B、9B 等国内优秀的大模型,MiniCPM 3.0 的表现同样相当出众。简单总结一下 MiniCPM 3.0 的特点:无限长文本,榜单性能超越 Kimi端侧最强 Function call,性能比肩 GPT-4o超强的 RAG 外挂三件套,中文检索、中英跨语言第一 无限长文本,性能超越 Kimi小而强、小而全,或许是 MiniCPM 3.0 最贴切的形容词。上下文长度是衡量大模型基础能力的一项重要特性,更长的上下文长度意味着模型能够存储和回忆更多的信息,从而有助于模型更准确地理解和生成语言。举例来说,更长的上下文长度能够让一个 AI 写作工具根据用户之前写的内容提供更相关的建议,或者根据更多的背景信息创作出更复杂、更引人入胜的故事。为此,面壁提出了 LLMxMapReduce 长本文分帧处理技术。这是一种通过将长上下文切分为多个片段,让模型并行处理,并从不同片段中提取关键信息,汇总最终答案,实现无限长文本。据悉,这一技术普遍增强了模型处理长文本的能力,且在文本不断加长的情况,仍保持稳定性能、减少长文本随加长掉分情况。▲ LLMxMapReduce 技术框架图从 32K 到 512K,MiniCPM 3.0 能够打破大模型记忆的限制,将上下文长度无限稳定拓展,用面壁官方的话来说就是「想多长就多长」。从大模型长文本的基准测试 InfiniteBench 结果来看,随着文本长度的增加,4B 参数的 MiniCPM 3.0 的性能优势反而愈发明显。InfiniteBench Zh.QA 评测结果显示,4B 参数的 MiniCPM 3.0 整体性能优于 Kimi,在更长的文本上显示出相对更强的稳定性。 端侧最强 Function call,性能比肩 GPT-4o在接受 APPSO 等媒体的采访时,曾国洋也表示,MiniCPM 3.0 针对用户关注的一些能力进行了提升,比如加入了完整的 system prompt Function Calling 和 code interpreter 等能力。其中 Function Calling(函数调用)能够将用户模糊化的输入语义转换为机器可以精确理解执行的结构化指令,并让大模型连接外部工具和系统。具体来说,通过语音在手机上调用日历、天气、邮件、浏览器等 APP 或相册、文件等本地数据库,从而打开终端设备 Agent 应用的无限可能,也让人机交互更加自然和方便。据介绍,MiniCPM 3.0 宣称拥有端侧最强 Function Calling 性能 ,在 Berkeley Function-Calling Leaderboard 榜单上,其性能接近 GPT-4o,并超越 Llama 3.1-8B、Qwen-2-7B、GLM-4-9B 等众多模型。曾国洋表示,现有的开源模型在这些能力上的覆盖并不全面,通常只有一些云端的大型模型能够完全覆盖这些能力。现在,MiniCPM 3.0 也实现了一些相应的功能。以 RAG(检索增强生成)为例,这是一种结合了信息检索(IR)和自然语言生成(NLG)的技术。它通过从大规模文档库中检索相关信息来指导文本的生成过程,能够提升模型在回答问题、生成文本等任务中的准确性和可靠性,减少大模型的幻觉问题。对于法律、医疗等依赖专业知识库、对大模型幻觉容忍度极低的垂直行业来说,大模型 +RAG 在行业中尤其实用。MiniCPM 3.0 一口气上线了 RAG 三件套:检索模型,重排序模型和面向 RAG 场景的 LoRA 插件。MiniCPM-Embedding(检索模型)中英跨语言检索取得 SOTA 性能,在评估模型文本嵌入能力的 MTEB 的检索榜单上中文第一、英文第十三。MiniCPM-Reranker(重排序模型)在中文、英文、中英跨语言测试上取得 SOTA 性能。经过针对 RAG 场景的 LoRA 训练后,MiniCPM 3.0-RAG-LoRA 在开放域问答(NQ、TQA、MARCO)、多跳问答(HotpotQA)、对话(WoW)、事实核查(FEVER)和信息填充(T-REx)等多项任务上的性能表现,超越 Llama3-8B 和 Baichuan2-13B 等业内优秀模型。 模型应用落地,先跑起来再说在接受 APPSO 等媒体的采访时,面壁智能 CEO 李大海提到,能跑起来和真正流畅地去做应用是两个不同的概念。而经过优化后的 MiniCPM 3.0 对端侧设备的资源需求很低,量化后仅需 2.2 G 内存,iPad 端侧推理也能达到 18-20 tokens/s。对于 iPad 这样的移动设备来说,每秒能够处理 18-20 个 token 的速度已经意味着模型能够实时处理自然语言输入。比如在语音识别或实时翻译应用中,用户基本不会感受到明显的延迟,享受到相对流畅的交互体验。另外,相较于云端模型,作为端侧模型的面壁小钢炮 MiniCPM 系列模型还天然具有弱网、断网可用、超低时延、数据隐私安全等本地优势。在贡嘎雪山附近游玩时,想知道欣赏「日照金山」的最佳姿势,网络不佳的你可以向 MiniCPM 3.0 发出提问。又或者,如果你是「赶海」的新人,站在波涛汹涌的海岸边,却想要满载而归,那不妨可以遵循 MiniCPM 3.0 给出的建议。当你抬头仰望夜空时,萌生了捕捉星轨的念头,MiniCPM 3.0 也能给你将拍摄的细节娓娓道来。MiniCPM 小钢炮系列飞速进步的背后是一以贯之的高效大模型第一性原理。面壁智能首席科学家刘知远曾提出一个大模型时代的「摩尔定律」,即大模型的知识密度平均每 8 个月将提升一倍。知识密度 = 模型能力 / 参与计算的模型参数具体来说,随着模型知识密度的持续增强,2020 年 GPT-3 175B 能力到 2024 年 MiniCPM 2.4B 模型即可达到,2022 年底 ChatGPT 首次亮相内置的 GPT-3.5 到 2024 年 MiniCPM 3.0 模型即可达到。基于此,如果说 MiniCPM 追求的是极致端侧性能表现,那么 MiniCPM-V 追求的是极致多模态创新表现,面壁小钢炮的进步不是单方面的进步,而是端侧双旗舰的齐头并进。经过一两年的技术摸索,AI 大模型正逐步进入落地应用的深水区。李大海认为,大模型具有两个大方向的价值,一个方向的价值叫做升级旧世界,第二个方向的价值则是发现新大陆。比如苹果整合 ChatGPT 服务到 Apple Intelligence 中便是一个典型的例证。端侧模型也是如此,通过在手机、汽车还有 PC 这样的场景里面,更适合做的事情是去服务好终端的厂商,然后让终端厂商因为有了端侧模型,整个系统层级的体验也变得更好。只不过,在技术到产品的惊险一跃中,厂商也需要投入大量时间来融合用户需求与技术。正如李大海所言,尽管移动互联网自 iPhone 问世以来就已经存在,但真正大规模增长和被验证的应用确实是数年后才开始涌现。实际上,面壁智能也一直在探索落地应用的场景。此前,面壁小钢炮 MiniCPM 端侧模型已经在 PC、平板、手机等领域上实际运行。前不久,面壁智能也在 WAIC 上联手加速进化机器人,打造出完整「具身智能」的先驱方案,这也是业界首个高效端侧模型运行在人形机器人的演示,理解、推理、并与物理世界互动的智能系统。李大海也向 APPSO 等媒体剧透,预计在年底前将会有配备面壁智能端侧模型的产品上市。简言之,面壁智能不断将高效高性能大模型放到离用户最近的地方,让大模型的能力像电力一样被随意调用、无处不在、普适且安全。在这个过程,更多的人也能尽快地享受到大模型的价值和作用。MiniCPM 3.0 开源地址:GitHub: https://github.com/OpenBMB/MiniCPMHuggingFace: https://huggingface.co/openbmb/MiniCPM3-4Bkoa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:钱生禄
TOP1热点:上单不让你去,你去不去?
康晓峰身为党员领导干部,政治上丧失理想信念,背弃初心使命,对党不忠诚、不老实,与多名行贿人串供,伪造、转移、隐匿证据,想方设法掩盖违纪违法事实,对抗组织审查,搞迷信活动;经济上贪婪无度,亦官亦商,利用担任县委、县政府“一把手”的职权,在干部选拔任用、工程项目建设等领域搞权钱交易,疯狂敛财,严重破坏所任职地区政治生态和营商环境,严重损害党的事业和形象。其行为已严重违纪违法,并涉嫌受贿罪,且在党的十八大后不收敛、不收手,性质严重,影响恶劣,应予严肃处理。依据《中国共产党纪律处分条例》《中华人民共和国监察法》《中华人民共和国公职人员政务处分法》等有关规定,经省纪委常委会会议研究并报省委批准,决定给予康晓峰开除党籍处分;由省监委按规定取消其享受的待遇;收缴其违纪违法所得;将其涉嫌犯罪问题移送检察机关依法审查起诉,所涉财物一并移送。。
6月27日凌晨1时左右,汶川县境内无人区受短时强降雨影响,致绵虒镇板子沟、威州镇新桥沟两处发生泥石流灾害,目前已转移群众900余人,7名群众失联。
TOP2热点:亚洲各国方便面是挪威最好吃的美食
李强表示,中越有着深厚的传统友谊,两国利益交融,命运与共。今年是中越建立全面战略合作伙伴关系15周年。在习近平总书记和阮富仲总书记引领下,两党两国关系发展保持良好势头。在复杂动荡的世界局势中,我们要更加注重维护发展好两国关系,共同推进社会主义事业,携手构建更加紧密的命运共同体,在新起点上把双边关系推上新台阶,为世界和平发展注入更多稳定性和正能量。
查询链接:江苏公布2023普通高校招生第一阶段录取控制分数线https://mp.weixin.qq.com/s/mH1qKaCn4gGd-iEfXQCHBg
TOP3热点:你说你……不想在这里!!!中国女人㓔精69XXXXXx视频
2020年11月,他临危受命,出任新设的新冠疫情应对部长。上任后不久,他便推出“交通灯”防疫政策,定期对全国各地区疫情进行动态评估,并制定了红、黄、绿三个疫情等级,因地制宜实施防疫政策。同时,他还积极在全社会推动新冠疫苗接种。在他的努力下,新西兰的疫情得到较好的控制,他的工作能力也获得社会肯定。
TOP4热点:【鲤鱼Ace/混剪】十年之约!这是独属于我们的青春与回忆[2015-2025精选集](下)女人㴬精69XXx喷潮
2021年11月18日,雅居乐间接全资附属公司又与威马汽车订立期权协议,将通过D轮优先股购买协议联合协议、行使期权等形式,认购威马汽车2.97%股份,总代价1.4亿美元。此外,雅居乐还根据威马上海股份认购协议转换“0元购”得到了996.33万股A类威马普通股。也即,雅居乐拥有了威马汽车4.58%的股权。
TOP5热点:亚洲各国方便面是挪威最好吃的美食把英语课代表按着抄视频
出访中国之际,范明政出席了河内首都区四环路奠基仪式。这是根据《公私模式投资法》开展的第一个国家重点项目。河内首都区四环路全长112公里以上,穿过河内市和兴安、北宁两省。
全国人大常委会秘书长刘奇作草案说明时表示,为贯彻落实党中央决策部署,依照全国人大组织法的规定,全国人大常委会委员长会议提请审议决定设立全国人大常委会代表工作委员会。
TOP6热点:完整版动画:是魔法,我加了爆炸魔法|大黑塔|911制片厂
9年来,通过“猎狐行动”,中国已从120多个国家和地区抓获外逃犯罪嫌疑人6000余名,追回赃款100多亿元人民币。还有不少上了“红通”名单的嫌疑人顶不住压力,主动回国投案。因中方的追逃方式以劝服为主,从未触犯各国法律,猎狐追赃得到多国警方和国际刑警组织的配合。
TOP7热点:听到女校霸的心声后给她准备了礼物男人的坤坤升到女人的坤坤
比如2014年12月,中美合作促成潜逃美国两年多的辽宁凤城市委原书记王国强投案;2016年11月,中方向美方提出协助遣返潜逃海外13年的“红通”嫌犯杨秀珠,美方将杨逮捕羁押,促其回国投案。
TOP8热点:为了赚钱,我找了一份观察微生物的工作!6种结局!Microbial Sector公〜好痛〜嗯〜轻一男男影片
据港交所官网信息统计下来,持有比亚迪股份14年的伯克希尔哈撒韦公司自2022年8月24日首次减持以来,其已经连续发起12次减持比亚迪H股股份的动作,持股比例自2022年8月24日的19.92%下滑至如今的不到8.98%。
近年来,我国生猪养殖规模化程度在逐渐提高。数据显示,2021年国内排名前十的规模养殖企业出栏量在市场中的占比,由2016年的4.94%提升至17.02%。
TOP9热点:你可以永远相信老祖宗的审美欧美致敬很多经典的黑白mv
6月27日,记者从汶川县应急管理局获悉,经抢险队现场沿河搜救,在汶川山洪泥石流灾害中已发现3名遇难者。经现场确认,其中2名遇难者是绵虒镇板子沟村失联的一对夫妻,另外1名遇难者正在核实身份。
TOP10热点:科技修仙!用科技实现御剑术的集群控制!武侠梦就此觉醒!中国macbookpro高清
出任总理后,希普金斯表示,自己已成为“公共财产”,但不希望家人也受到影响。在一次采访中他说:“我希望我的孩子能有犯错的机会,我想让他们从错误中学习和成长,而不用担心有500万人关注着他们的一举一动。我希望他们在公众视野之外生活。”
公开简历显示,李春生出生于1961年,曾在公安部工作,2013年任广东省政府副省长、党组成员,省公安厅党委书记、厅长,2021年转任广东省人大常委会副主任。