教育新视-"火箭少女101拔萝卜视频"-AI视频时代,如何才能不掉火箭少女101拔萝卜视频队?

火箭少女101拔萝卜视频AI视频时代,如何才能不掉火箭少女101拔萝卜视频队?

火箭少女101拔萝卜视频AI视频时代,如何才能不掉火箭少女101拔萝卜视频队?

AI视频时代,如何才能不掉火箭少女101拔萝卜视频队?

  8月21日,贷款市场报价利率(LPR)迎来年内第二次下降,1年期LPR较上一期下降10个基点。专家认为,近三个月LPR两次下降,逆周期调节力度明显加强,释放出积极的政策信号,有助于推动经济持续回升向好。

图源|AI生成让你反复点赞收藏的短视频,或许已经不是人类做的了。不久前,一段“皮卡丘打工”的AI视频,在全网流传爆火。精美的画面,流畅的动作,以及丝滑的雨滴,几乎可以与大制作的动画电影相媲美。更久之前,今年抖音上爆火的科幻短剧《三星堆:未来启示录》,同样是由AIGC生成。这部剧12集,每集3分钟,讲述考古工作者联手揭开古蜀国神秘面纱的故事,一经上线,就引发1.4亿播放。其背后的技术支持字节旗下视频生成工具即梦,也随之引发市场关注。技术的普及与工具的成熟,让视频创作门槛快速降低,在AI的助推下,用户从单纯的内容消费者升级为生产、消费和拥有的三位一体,视频的总量也随之爆炸性增长:当前,视频数据的规模飞速增长,IDC预计,2025年全球数据量将达到175ZB,其中绝大部分将来自视频数据,而这一趋势,还将继续加速。但AI视频时代,主角不止有AI。同一时期,在消费端,随着全景直播、三维重建的成熟,伴随着国产3A大作《黑神话:悟空》中AI技术结合无人机实景三维重建实现真实场景的纹理与细节以1:1的比例精准还原,视频的交互与消费链路也从此被重构。技术的成熟,叠加应用的爆发,AI视频的战争,正迎来市场化为导向的下半场。AI视频时代的三座大山以AI技术为为表,一个新的视频生产、交互、消费时代正在缓缓拉开序幕,但近在眼前,仍有三座大山有待翻过。与大家发布会上杀得你死我活形成鲜明对比的是,具体的场景之中,真正好用的产品并不多见。两者中间的鸿沟,来自工程化。一个简单的例子,仅在AI视频生成环节,业内发布会上,AI生成的视频中,小猫会正常跳跃,展示出的技术水平就已经遥遥领先;但现实中,一个会正常跳跃的小猫,只是最基础的要求,视频本身的内容与趣味的重要性,远远高于对AI技术的追求。更具体来说,在生产端,成本与效率,正逐渐成为一个越来越棘手的难题。一方面AI视频生产的赛道正随之变得前所未有的拥挤。Sora发布引发全球视频大模型热潮,AI视频的赛道也在很快的时间里变得拥挤。仅仅在国内,就先后出现了字节系即梦、快手系可灵,创业公司系Pika、智谱清影、生数科技Vidu等一众明星产品。然而,生成式AI带来的视频数据指数级增长对计算效能提出了严峻考验;年初推出的Sora模型的训练算力需求是GPT-4的4.5倍,而推理算力需求更是接近GPT-4的400倍。无论文生视频,还是图生视频,相关的算力指标动辄几十上百T,甚至高达千T,这种激增的成本,带来了算力资源的可负担性的挑战。与此同时,多模态媒体处理挑战也日益凸显。多模态媒体处理需求的日益凸显对音视频处理的生产端、交互端和消费端提出了全新要求;生产端,多模态内容的生产是否足够高质高效,比如给用户交付的究竟是模型、API还是一个类似即梦这样的软件都对应着不同的用户分层;交互端,当我们的交互从传统的单模态人机变成多模态交互乃至人与AI的交互,如何让机器更直观的理解人类的需求,依旧是个困扰,消费端,如何让交互空间从2D升级到3D乃至虚实融合,也对内容的创作以及呈现本身提出了更高要求。同时,如何让技术应用真正落地并带来实际业务价值也是我们必须面对的问题。AI视频很火,但成本同样不低,如何让内容生产出来之后能带来确定的收益,会决定AI视频长久的生命力。单点的问题解决,需要编解码技术的更新,需要有应对洪峰波谷的能力,需要AI的加持。但系统性问题,需要的,则是一个所有能力的融会贯通,从生产端,到交互端,再到消费端的全链路解决方案。而这,或许正是火山引擎视频云最擅长的地方。过去Sora等技术的成熟只是点燃了0到1的火种,但AI视频真正的爆发,还需要从1到100漫长的累积。如何定义AI视频时代AI视频时代的到来理所当然,但如何定义AI视频时代,这曾是火山引擎视频云内部,一个长期的思考题。通往未来的门票,就藏在对过去历史的梳理中。经过复盘总结,火山引擎视频云认为,围绕视频,我们的时代,可以被分为三个阶段:第一阶段,信息时代。以传统的UGC短视频内容为代表,我们中的大部分都是内容的消费者,我们与视频的交互,以手机屏幕的2D体验为代表,是一个在线、双向的过程;第二阶段,到了数字时代,我们对视频品质的要求越来越高,PGC成为内容生产的主流,直播兴起带来交互上的实时、流畅、高清,而交互的空间,也从二维逐渐向三维空间过渡。这是一个生产侧内容的品质不断提升,交互侧效率不断提升,消费端交互体验与空间不断升维的过程。相应的,AI视频时代,自然也不等同于传统的数字视频时代加上AI能力,故事依旧要回到生产、交互、消费的叙事中来。首先是生产端。AI的加持,抹平了视频制作水平差距带来的鸿沟,AI辅助视频制作,逐渐成为各大软件,人人可用、人人会用的基础技能。我们不再局限于主动的内容生产与被动的内容消费,在AI视频时代,用户将成为AI原生居民,既是内容的生产者,也是消费者,更是拥有者。在这背后,则是AI技术从过去的问答,到图文交互,再到如今多模态交互,多模态内容生产的一步步跨越。而在交互端,技术的成熟,则进一步拉近了人与视频,真实世界与数字之间的连接。过去,留言的存在,让人人交互成为可能;直播等技术的兴起,通过互联网的链接,让人与人的实时交互得以实现。而以GPT-4o、火山引擎对话式AI实时交互解决方案等技术为代表,人与AI的交互,则在多模态的基础上,变得更加实时流畅、逼真与拟人。全球市场研究机构MarketsandMarkets曾做出预测,到2028年,全球AI助手市场规模将达到285亿美元。在这背后,2023—2028年的复合增长率将达到惊人的43%。消费端的这个趋势是更沉浸。以年初苹果发布的Vision Pro为代表,空间计算的新时代正式开启。在此之后,今年7月,抖音VR直播上线,9月《黑神话:悟空》以其极具震撼力的视频画面质感、跌宕起伏的剧情架构和深厚的文化底蕴,迅速吸引了全球玩家的目光。3D、虚实融合与VR技术,将成为消费端变革的主力军,架起数字世界与物理世界之间的桥梁。方向已经确认,一个新的时代就在眼前呼啸而来,接下来,火山引擎视频云的重点工作,就是去梳理在这次史无前例的市场爆发中,究竟还有多少痛点没有被解决,而火山引擎,手里又还有多少张牌。为什么是火山引擎视频云当确定了未来的大趋势,与眼前的具体困境后,接下来的故事就进入了火山引擎视频云最擅长的剧情,从生产到交互再到用户体验的全方位重构。而这一切的基础,则是框架层的创新。AI视频时代,超大规模视频训练数据集,导致了计算和处理成本激增;而伴随着视频数据质量参差不齐,数据样本的分类、分段和清洗也带来了庞大的工作量;整体处理链路涉及多个环节,工程复杂,需要多团队协作。相应地,对于视频云来说,框架不仅需要支持大模型的高效运行,还要能够满足日益复杂的音视频处理需求,以应对生成式AI时代带来的挑战。为此,火山引擎联合英特尔共同发布了BMF大模型训练视频预处理方案并升级了大模型与AI能力。BMF在本次大会上,推出了不依赖任何第三方组件的轻量化开源版本BMF-lite。通过kernel融合等创新方案,BMF-lite实现了算子加速能力,大幅提升了视频处理的效率。在通用性上,BMF-lite则提供了多平台统一的接口形式,让所有开发者都能轻松使用BMF-lite。而随着视频处理越来越从云上向端侧迁移,BMF-lite还新增了对端侧大模型的接入支持,为AI技术的融合提供了强大的支持。当前BMF-lite已经广泛地应用在了抖音的各个业务上,每天服务于上亿用户,处理视频图片万亿次。此外,应对成本挑战,火山引擎通过海量的潮汐资源和精细化的混部调度来降低单用户的平均使用成本;而为了应对质量挑战,火山引擎视频云使用多种算法对视频进行多维度的分析和筛选,在实践中沉淀了50多个算子对视频进行了精细化的过滤;对于协同挑战,火山引擎视频云利用BMF的动态模块的特性,在短时间内完成了几十个算子的集成和处理链路的开发,迭代效率相比使用传统框架提升了数倍。应对性能挑战,基于英特尔CPU等各种不同的资源,火山引擎视频云则利用BMF框架的灵活调度,将复杂的算子处理流程灵活的部署在多种资源上,并实现了快速的性能调优,提升了任务吞吐,缓解了资源瓶颈。在这背后,则是硬件在算力侧提供的稳定支持。为了应对多元的业务需求,选择不同的硬件来进行视频处理以实现最佳的性价比,是几乎所有企业都会面临的问题。英特尔强大的至强CPU处理能力,可以为8K视频实时处理、包括传统的CV视觉优化、LLM和AIGC在内的多种AI应用,各种类型业务在火山引擎上的部署,提供强大的计算支持和可靠的服务。与此同时,为了应对生成式AI时代,海量视频数据,用户高质量视频需求,不同对象丰富场景等需求,BMF还推出了灵活高效大模型训练视频预处理能力,通过视频净化、多种算子、组合输出、大规模部署等技术,目前已经在生产环境中,取得良好效果。而基于这种框架层面的创新,以及反复的内部练兵以及外部用户需求调研,针对市场痛点,火山引擎做出了三步走计划。第一步,在生产端,降低视频的生产门槛,带动AI视频时代,人人成为视频内容的消费者、生产者以及拥有者。基于这一认知,火山引擎视频云推出了多模态视频理解与生成方案,依托自研AI视频理解技术和AIGC技术,可以做到自动化提取视频高光和生成解说内容,让字幕识别错误率降低了30%。目前,该方案已探索针对短剧、赛事和直播电商的自动化解决方案。能够针对长视频进行智能拆分、高光片段提取和产出摘要描述,能够在提高人效的同时保证内容的精准传达。同时,结合AIGC技术生成视频素材,创作者可以快速完成预告片的视频生产,能够显著缩短制作周期并降低成本。为了让内容生成更加丰富有趣,火山引擎视频云还落地实践了多模态营销素材生成方案,通过融合图像分析、AIGC(人工智能生成内容)、大模型处理、3D物体重建等先进技术,实现了商品氛围图、图文视频、解说视频、AIGC视频和3D商品模型等多模态营销素材的自动化生产。目前,这些创新服务已经支持自营电商智能氛围图的端到端自动化托管,并且在电商场景的核心指标上取得了显著提升。当然,这种生产端的升级,并不止于视频画面,声音技术的升级同样重要。火山引擎视频云通过采用了自研的豆包语音大模型,实现了高品质多语言声音复刻,并利用虚拟人技术调整演讲者口型,让观感更加自然。而在交互端,火山引擎视频云则推出了对话式AI实时交互解决方案,通过火山引擎豆包大模型和视频云RTC技术实现了语音数据的高效采集、处理和传输,并在服务端,并为用户提供了智能对话和自然语言处理的强大能力,毫秒级人声检测和打断响应,以及丝滑稳定的端到端响应体验。当前,这一方案已经广泛应用于智能助手、AI陪伴、AI教育、智能客服等场景,并为用户带来更自然、流畅和真实的人机交互体验。框架的建构,解决了生产端的效率;交互的革新,带来了产品体验的进一步升级,AI视频时代的未来已经初见雏形,但要让全链路的升级更加完整,还差最后一步——消费端的沉浸式体验升级。今年以来,随着《黑神话:悟空》爆火,带动3D生成和场景重建技术兴起,火山引擎视频云推出了基于AI的3D生成方案,借助大模型强大的生成能力,采用基于图生3D的模式来完成3D内容的快速构建。同时,火山引擎视频云还上线了高质量3D Gaussian-Splatting场景重建及低延迟重渲染方案,用于对场景进行高质量的几何、外观重建和渲染,并实现行业内首个高斯方案支持复杂的实时重打光及阴影渲染。目前,该技术已经实际应用在虚拟直播等VR/AR/XR应用中,相比传统的手工3D建模,在效率、多样性和操作成本等方面具备明显优势。一定程度上,AI视频时代,技术只是引爆一切的起点,但真正的商业化,则需要以用户的体验为核心,从框架到场景,从生产到交互再到消费端的全方位发力,市场也随之进入马拉松长跑阶段。火山引擎视频云,为这场长跑的下半场,做了一次不错的探索。本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com

koa12jJid0DL9adK+CJ1DK2K393LKASDad

编辑:章汉夫

TOP1热点:安徽卫视春晚节目组回应“外卖小哥”身份争议:确认其从事外卖工作

  国信证券的一份研报测算称,银行要维持支持实体的能力,每年资产增速要处于名义GDP增速(7%)附近,那么未分配利润留存资本的增速也得在7%附近。按分红率(30%)倒算出ROE应该在10%左右。再考虑其他收入、支出水平不变,那么净息差应该在1.68%左右,再留点安全垫,应该在1.8%左右。

  乔良介绍,取证的通常做法是调取录音录像,回溯当时销售情形,或者调查涉事业务员。但是保险从业人员流动性很大,如果联系不上业务员,又没有当时留下的录音录像证据,保险公司很难说清自己没有过错,不排除存在花钱消灾的情况。

TOP2热点:只讲三点|日本男星性侵牵出知名电视台“性招待”丑闻,惊动首相

  8月1日,中国人民银行、国家外汇管理局下半年工作会议提出,指导商业银行依法有序调整存量个人住房贷款利率。这是央行近一个月第二次针对存量房贷利率调整发声。

  在中央社会工作部组建之前,许多人从专业技术概念上理解“社会工作” (Social Work),即社会工作是一种职业化的助人活动,其特征是向有需要的人特别是困难群体提供科学有效的服务。

TOP3热点:大风、寒潮、暴雪,中央气象台三预警齐发51吃瓜今日吃瓜必吃

  二是当前房贷利率的焦点是存量和新增利差较大。央行数据显示6月新发放个人住房贷款加权平均利率为4.11%,同比下降0.51个百分点,处于历史低位。此外,现阶段存量中仍有相当部分执行超过5%贷款利率,远高于目前新发放按揭利率。

  据国家体育总局网站26日消息:国家体育总局冬季运动管理中心党委书记、主任倪会忠涉嫌严重违纪违法,目前正接受中央纪委国家监委驻国家体育总局纪检监察组和河南省监察委员会审查调查。

TOP4热点:春晚节目单港澳台演员不再单独标注:同为中国人,不必分彼此警犬张津瑜在线观看亚洲

  阿水在楼道里坐到凌晨两点多,等其他人都睡了,才下到一楼,猫在楼梯旁,又待了30分钟,试探有没有人发现他跑了——这时被发现,他还可以找借口,说厨房里有电器没关好。

  财联社8月21日电,8月1年期贷款市场报价利率(LPR)报3.45%,上月为3.55%;5年期以上LPR报4.2%,上月为4.2%。

TOP5热点:视频丨现场证据来了!菲律宾登铁线礁被我海警拦下桃乃木 torrent magnet

  21日,在中国外交部例行记者会上,法新社记者提问:“朝鲜的高丽航空公司三年多来首次执飞从平壤出发到北京的商业航班,该航班原定将于今日抵达北京,但后续被取消了。请问你是否了解航班被取消的原因?朝鲜边境何时将重新对游客开放?”

  阿水没受到体罚,是因为公司人手不足,还是要先把他笼络住。不过他后来了解到,即使是大公司,也都是先来“软的”,再上“硬的”,毕竟公司的目的还是让人诈骗拉单。

TOP6热点:王星案重要犯罪嫌疑人“颜十六”到案我把护士日出了水

  今年以来,中国人民银行不断优化调整房地产金融政策,支持刚性和改善性购房需求。特别是首套住房贷款利率政策动态调整机制加速落地,带动多地房贷利率有所降低。

  《中国新闻周刊》此前曾报道,吴汉圣兼具部委、地方工作经历,曾在中央和国家机关工委工作多年,也曾主政地市,还担任过协调能力要求较高的省委秘书长一职,也熟悉纪检监察工作。

TOP7热点:百余种非遗现身,央视蛇年春晚创下多个收视纪录天天高潮夜夜爽

  据国家体育总局网站26日消息:国家体育总局冬季运动管理中心党委书记、主任倪会忠涉嫌严重违纪违法,目前正接受中央纪委国家监委驻国家体育总局纪检监察组和河南省监察委员会审查调查。

  7月30日12时,水利部将京津冀洪水防御应急响应提升至Ⅱ级,要求有关省市即刻进入应急响应工作状态,迅速周密有序做好蓄滞洪区运用准备。

TOP8热点:第一个上春晚的外卖诗人,为春节写下了这些诗十大禁止安装app软件

  中国人民银行授权全国银行间同业拆借中心公布,2023年8月21日贷款市场报价利率(LPR)为:1年期LPR为3.45%,相比上月下降10BP;5年期以上LPR(以下简称1年期)为4.2%,和上月持平,二者降幅均低于市场预期。

  经核查,网传“8月开始,银行将永久冻结部分存款账户”纯属谣言。根据《中华人民共和国中国人民银行法》《中华人民共和国商业银行法》等法律法规,银行必须保护存款人利益。在实际生活中出现的银行冻结账户情形也需要遵循相应的法律程序,不存在仅凭一纸公告或所谓的内部文件就冻结账户的情况。

TOP9热点:新一年,更澎湃!桃乃木 torrent magnet

  停靠期间,编队指挥员与马来西亚官员进行了会谈,马来西亚海军官兵参观了编队舰艇,进行了足球友谊赛。编队南宁舰组织隆重的甲板招待会,为嘉宾们精心准备了中国特色美食,表演了舞狮、太极拳、书法等传统文化,加强了两国海军官兵的深厚情谊,加深了两国之间的友好关系。

  王青进一步指出,8月5年期以上LPR报价按兵不动,很可能意味着后期“调整优化房地产信贷政策”会单独出台具体措施,其中或包括更大力度实施首套房贷利率政策动态调整机制,以及下调二套房贷利率下限等。总体上看,下一步引导新发放居民房贷利率下行是大势所趋。

TOP10热点:今晚看春晚丨到湾区过大年,辽宁卫视笑赢新春桃乃木 torrent magnet

  央行近期发布的二季度货币政策执行报告专栏文章《合理看待我国商业银行利润水平》表示,商业银行向实体经济发放贷款面临资本约束,化解风险也要消耗资本,我国对商业银行资本充足率有明确的监管标准。商业银行维持稳健经营、防范金融风险,需保持合理利润和净息差水平,这样也有利于增强商业银行支持实体经济的可持续性。

  对此,发言人汪文斌表示,中方对新冠病毒感染实施乙类乙管总体方案发布后,自2023年1月8日起,恢复受理中外航司恢复国际客运航班的申请。2023年夏秋航季换季工作当中,中方根据航空公司申请按程序批复了朝鲜高丽航空平壤—北京—平壤等客运航线定期航班计划。“具体航班由航空公司按照中方主管部门的批复执飞。以上是我目前掌握的消息。”

发布于:洪江市