30个交往技巧视频直播视频生成无损提速30个交往技巧视频直播:删除多余token,训练时间减少30%,帧率越高效果越好_ZAKER新闻
视频生成无损提速30个交往技巧视频直播:删除多余token,训练时间减少30%,帧率越高效果越好_ZAKER新闻
“农业发展到今天,取得了非常不错的成绩,但也仍面临着‘靠天吃饭’的问题。”沐曦研发部副总裁黄向军在论坛上表示,农业数字化发展是从传统农业到小规模农业、到自动化农业、再到智慧化农业的过程。当前,尽管我国整体上处在农业数字化转型过程中,但农业数字化发展有非常好的产业基础。农村电信基础设施不断优化,农民数字技能也在持续提升,农业数字化服务技术和产品也在日益成熟。
Don ’ t look twice!把连续相同的图像块合并成一个 token,就能让 Transformer 的视频生成速度大幅提升。卡内基梅隆大学提出了视频生成模型加速方法Run-Length Tokenization(RLT),被 NeurIPS 2024 选为 Spotlight 论文。在精度几乎没有损失的前提下,RLT 可以让模型训练和推理速度双双提升。一般情况下,利用 RLT,Transformer 视频模型的训练时间可缩短 30%,推理阶段提速率提升更是可达 67%。对于高帧率和长视频,RLT 的效果更加明显,30fps 视频的训练速度可提升 1 倍,长视频训练 token 减少 80%。相比于传统的剪枝方法,RLT 能用更小的精度损失实现更好的加速效果。有人想到了电视剧中的评论,认为这项研究找到了在压缩空间中进行搜索的方法。DeepMind 科学家 Sander Dieleman 则评价称,这项研究是一种 " 非主流 "(Off-the-grid)的创新方法,但比起其他复杂的非主流研究,又显得非常简洁。重复图像块合为一个 tokenRLT 的核心原理,是利用视频中存在大量时间上重复的图像块这一特点,将重复的图像块合并为一个 token 表示。这种情况下,还需要用一个位置编码来表示这个 token 的长度,但 RLT 总体上减少了输入的 token 数量。要想完成重复 token 的修剪,首先要对视频进行分块。具体来说,视频在空间和时间维度上会被划分成固定大小的图像块,每个图像块的大小为 C × D_x × D_y × D_t,每个图像块都对应一个空间 - 时间位置。(其中 C 是通道数,D_x 和 D_y 是空间维度大小,D_t 是时间维度大小。)划分完成之后,需要比较时间上相邻的图像块,判断它们是否相似,也就是是否需要合并。对于时间位置相差 1 的两个图像块 P_1 和 P_2,取 P_1 的第一帧和 P_2 的最后一帧,计算它们的 L1 距离。如果距离小于一个预设的阈值 τ,就认为 P_1 和 P_2 是静态重复的(阈值 τ 表示允许多大程度的相似性,设置与具体数据集无关)。完成判别之后,重复的图像块会被移除。对于一串连续的、两两之间都是静态重复的图像块,RLT 只保留第一个块对应的 token。这一步是在 patch embedding 之前完成的,因此移除 token 不需要改动模型结构。经过这一步,输入的 token 数量从 N_P 降低到了 N_P ’(N_P ’≤ N_P)。为了让合并后的 token 仍然能够反映完整的视频信息,接下来要给每个 token 加上长度编码。对于一个保留下来的 token,系统会计算它所代表的原始 token 的长度 l_i,也就是它到下一个没有被移除的 token 的距离。长度信息 l_i 与 token 的空间 - 时间位置 ( x,y,t ) 一起,用一个可学习的长度编码矩阵映射成一个 d 维的 embedding 向量,与 patch embedding 相加,作为输入 token 的最终表示。最后只需要将处理后的 token 序列输入到视频 Transformer 中,进行常规的训练或推理过程。不过需要注意的是,由于每个视频样本计算出的 token 数量 N_P ’不尽相同,样本之间可能有较大差异。然而标准的 Transformer 是按批次处理固定长度的序列的。为了能在一个批次中处理多个长度不一的视频,RLT 采用了一种称为 "example packing" 的方法,将这一批中所有视频样本的 token 序列首尾相连,拼成一个超长的序列,作为 Transformer 的输入。这样的话,Transformer 实际上是在处理一个批次大小为 1、长度为所有样本 token 数量之和的序列。通过以上步骤,RLT 能够去除视频中的许多冗余 token,在几乎不损失精度的情况下,大幅降低内存占用和计算量,加速视频 Transformer 的训练和推理。训练时长下降 30%在训练阶段,RLT 对 ViT-B 和 ViT-L 两种规模的模型都有很好的加速效果。在 Kinetics-400 上,ViT-BRLT 和 ViT-L 训练时间分别从 14.4 小时和 21.6 小时,降低到 10.2 小时和 15.4 小时,降幅均接近 30% 左右,精度损失不超过 0.1 个百分点;在 SSv2 上,两者的训练时间分别从 10.1 和 15.2 小时,降低到 7.2 和 10.8 小时,降幅也接近 30%,精度同样仅下降 0.1 个百分点。相比之下,传统的剪枝方法 Token Merging 在精度下降 0.1-0.5 个百分点的情况下,加速只有 10-20%。在推理阶段,也不需要额外的训练,就可以将 RLT 作为现成的 tokenizer,达到很好的加速效果。具体来说,RLT 能在几乎不牺牲精度的情况下(不超过 0.5 个百分点),将推理阶段的计算量和延迟降低 30-60%。同样在 Kinetics-400 和 SSv2 上,对于 ViT-B 和 ViT-L,RLT 都能带来 60% 以上的推理加速。对于更大的 ViT-H,在 Kinetics-400 上,RLT 也能实现 45% 的加速效果。特别地,作者还针对高帧率和长时长视频数据集进行了测试,发现 RLT 带来的 token 下降幅度比在普通数据集中更高。同时在高帧率数据集当中,RLT 能够在精度损失同样低的情况下,实现更好的加速效果。而且帧率越高效果也越明显,对于 30fps 的视频,加速可达 100%。论文地址:https://arxiv.org/abs/2411.05222代码:https://github.com/rccchoudhury/rltkoa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:张石山
TOP1热点:做“好人”只能成为社会的垫脚石,还要坚持善良和良知吗?大雁真心话:做大事的人一定靠真诚和善良!
习近平总书记指出:“要继续发挥中央生态环境保护督察利剑作用。”开展环境保护督察,是党中央、国务院为加强环境保护工作采取的一项重大举措,对加强生态文明建设、解决人民群众反映强烈的环境污染和生态破坏问题具有重要意义。实践充分证明,中央生态环境保护督察制度建得好、用得好,敢于动真格,不怕得罪人,咬住问题不放松,成为推动地方党委和政府及其相关部门落实生态环境保护责任的硬招实招,成为推进生态文明建设的重要抓手。要总结运用中央生态环境保护督察制度建立实施以来的成果和经验,围绕中心、服务大局,始终坚持问题导向,把握重点和关键,推动中央生态环境保护督察工作不断向纵深发展。要压紧压实全面从严治党主体责任,持续强化督察队伍建设,为做好中央生态环境保护督察工作提供坚强保障。各级党委和政府要关心、支持生态环境保护队伍,主动为他们排忧解难、撑腰打气。。
TOP2热点:一口气看懂特朗普上任对全球经济的影响
穆沙希德・侯赛因认为,评判一种民主形式好不好,归根结底要看能不能让人民过上好日子。“政党应该倾听人民呼声、响应人民诉求。民主作为一种制度安排,意味着能够为实现人民更加美好的生活需要采取行动,使人民有更大的获得感,如充分的就业、安全舒适的环境、正义诉求的满足等。”
“15年来,眷村故事说不完、道不尽,演出在继续。有了舞台,我们才能更好地呵护这样一段难得的共同记忆。”话剧监制丁乃竺认为,新老几代演员在巡演舞台上亲密配合,这是一桩难得的盛事。
TOP3热点:“即便是坠落,也应该有流星般的华丽”沉香产区有无一线二线的区分
大树脚村的村委会副主任刘平对记者说:“大象吃掉庄稼以后,给保险公司打电话,村上有理赔员,根据他实际的踏勘,确认后往公司上报,然后把赔偿直接打到村民的惠农卡里。”
“让祖国人民、子孙后代知道志愿军是在怎样恶劣的环境下坚持战斗的”
TOP4热点:爬山是你的谎言【大擂台】刘禅踩着板凳孙尚香谁画的
2019年,我从华东师范大学硕士毕业,来到芦溪县银河镇紫溪村任党支部书记助理、驻村工作队员。刚进村时不知道村民关注什么,一系列摆在面前的困难让我有点茫然。后来,通过请教身边的领导同事,我终于找到了“解题方法”:在调查研究上下足“笨功夫”。不到半年,我走遍了村里的33个村民小组,深度访谈了60多位党员,遍访了产业大户和村民,坚持每天撰写民情日记。我逐渐熟悉了村情,发现了真问题,也解决了不少群众的急难愁盼问题。
一分部署,九分落实。抓落实,是党的政治路线、思想路线、群众路线的根本要求,也是衡量领导干部党性和政绩观的重要标志。
TOP5热点:“有些人天生就是主角“全新国产max485csa
咸宁市嘉鱼县于22日上午8时许发布暴雨红色预警,全县大部分地区3小时内降水量达到100毫米,暴雨侵袭导致城区多处内涝,嘉鱼县消防救援大队迅速组织多支救援小组,分批出动迅速展开救援。
TOP6热点:是谁杀了我?而我又杀了谁?粗大黑头紫大黑头紫bl
深入挖掘经典内涵,可以更好发挥书法美育价值。千百年来,以汉字为载体的中国书法,书写着灿烂辉煌的中华文化,涌现了大批文质兼美的精品力作。研究好、展示好、传播好这些经典作品,是提升大众审美素养、丰富人民精神世界的重要手段。《中国书法大会》第一季聚焦中国书法史上极具代表性的18件(组)作品,用时间跨度长达3000年的书法作品串联起源远流长的历史文脉,展示书法之道,传播汉字之美。节目既发挥了文字历史教育功能,也担负起书法审美普及的重任。每期特邀的两位书法嘉宾、一位文化嘉宾,从知识和审美普及两方面展开讲解,力求深入浅出、启智增慧,使观众更易理解和体悟书法之美。
“盐碱区往往也是生态脆弱区、敏感区,因此治理改良使用的技术、产品不仅要有效,还要安全、绿色,避免污染破坏耕地和环境。”李玉义说。
TOP7热点:“有些人天生就是主角“黑人的性能强大与哪些因素有关
南海应该成为造福周边国家的合作之海。东盟国家和中国都希望进一步拓展海上合作,促进共同发展繁荣。在海洋经济、海洋科技、海洋生态环境保护等各方面,东盟国家同中国拥有广阔合作空间。通过共同努力,双方一定能充分释放海洋合作潜力,为各自发展增添动力,同时也为维护南海和平稳定积累更多互信,凝聚更大共识。
“盐碱区往往也是生态脆弱区、敏感区,因此治理改良使用的技术、产品不仅要有效,还要安全、绿色,避免污染破坏耕地和环境。”李玉义说。
TOP8热点:是谁杀了我?而我又杀了谁?八重神子去内奖励旅小女孩
科技既要“顶天”也要“立地”。要把满足人民对美好生活的向往作为科技创新的落脚点,把惠民、利民、富民、改善民生作为科技创新的重要方向。
TOP9热点:和Links爬了一趟雪山,我悟了。test英语
…………
俄国防部称,当地时间22日中午12时许,乌克兰武装部队使用集束弹药对今日俄罗斯通讯社和俄《消息报》等媒体记者发动炮击,当时这些记者正准备就乌军使用集束弹药炮击扎波罗热州做相关报道。
TOP10热点:世界线DAY1有收到小礼物吗?我想抓一下球球视频
“22年来,作为世界上海拔最高的国际性公路自行车赛事,环湖赛秉承绿色、人文、和谐、体验的主题,传承更快、更高、更强的精神,坚持专业化、市场化、国际化定位,促进体育赛事与生态保护、文化旅游、交流合作深度融合、相得益彰,向世人展示大美青海生态之美、发展之美、人文之美。”青海省省长吴晓军说,希望大家在绿色低碳的运动方式中,纵情体验自行车运动的速度与激情,尽情领略青海山川的雄奇与壮美,以赛事为媒,传播绿色,倡导健康,促进交流。(记者王雯静万玛加)