热点聚焦-"X姓女RAPPER的首次亮相"-AI视频时代,如何才能不X姓女RAPPER的首次亮相掉队?

X姓女RAPPER的首次亮相AI视频时代,如何才能不X姓女RAPPER的首次亮相掉队?

X姓女RAPPER的首次亮相AI视频时代,如何才能不X姓女RAPPER的首次亮相掉队?

AI视频时代,如何才能不X姓女RAPPER的首次亮相掉队?

香港券商员工能否炒股?

图源|AI生成让你反复点赞收藏的短视频,或许已经不是人类做的了。不久前,一段“皮卡丘打工”的AI视频,在全网流传爆火。精美的画面,流畅的动作,以及丝滑的雨滴,几乎可以与大制作的动画电影相媲美。更久之前,今年抖音上爆火的科幻短剧《三星堆:未来启示录》,同样是由AIGC生成。这部剧12集,每集3分钟,讲述考古工作者联手揭开古蜀国神秘面纱的故事,一经上线,就引发1.4亿播放。其背后的技术支持字节旗下视频生成工具即梦,也随之引发市场关注。技术的普及与工具的成熟,让视频创作门槛快速降低,在AI的助推下,用户从单纯的内容消费者升级为生产、消费和拥有的三位一体,视频的总量也随之爆炸性增长:当前,视频数据的规模飞速增长,IDC预计,2025年全球数据量将达到175ZB,其中绝大部分将来自视频数据,而这一趋势,还将继续加速。但AI视频时代,主角不止有AI。同一时期,在消费端,随着全景直播、三维重建的成熟,伴随着国产3A大作《黑神话:悟空》中AI技术结合无人机实景三维重建实现真实场景的纹理与细节以1:1的比例精准还原,视频的交互与消费链路也从此被重构。技术的成熟,叠加应用的爆发,AI视频的战争,正迎来市场化为导向的下半场。AI视频时代的三座大山以AI技术为为表,一个新的视频生产、交互、消费时代正在缓缓拉开序幕,但近在眼前,仍有三座大山有待翻过。与大家发布会上杀得你死我活形成鲜明对比的是,具体的场景之中,真正好用的产品并不多见。两者中间的鸿沟,来自工程化。一个简单的例子,仅在AI视频生成环节,业内发布会上,AI生成的视频中,小猫会正常跳跃,展示出的技术水平就已经遥遥领先;但现实中,一个会正常跳跃的小猫,只是最基础的要求,视频本身的内容与趣味的重要性,远远高于对AI技术的追求。更具体来说,在生产端,成本与效率,正逐渐成为一个越来越棘手的难题。一方面AI视频生产的赛道正随之变得前所未有的拥挤。Sora发布引发全球视频大模型热潮,AI视频的赛道也在很快的时间里变得拥挤。仅仅在国内,就先后出现了字节系即梦、快手系可灵,创业公司系Pika、智谱清影、生数科技Vidu等一众明星产品。然而,生成式AI带来的视频数据指数级增长对计算效能提出了严峻考验;年初推出的Sora模型的训练算力需求是GPT-4的4.5倍,而推理算力需求更是接近GPT-4的400倍。无论文生视频,还是图生视频,相关的算力指标动辄几十上百T,甚至高达千T,这种激增的成本,带来了算力资源的可负担性的挑战。与此同时,多模态媒体处理挑战也日益凸显。多模态媒体处理需求的日益凸显对音视频处理的生产端、交互端和消费端提出了全新要求;生产端,多模态内容的生产是否足够高质高效,比如给用户交付的究竟是模型、API还是一个类似即梦这样的软件都对应着不同的用户分层;交互端,当我们的交互从传统的单模态人机变成多模态交互乃至人与AI的交互,如何让机器更直观的理解人类的需求,依旧是个困扰,消费端,如何让交互空间从2D升级到3D乃至虚实融合,也对内容的创作以及呈现本身提出了更高要求。同时,如何让技术应用真正落地并带来实际业务价值也是我们必须面对的问题。AI视频很火,但成本同样不低,如何让内容生产出来之后能带来确定的收益,会决定AI视频长久的生命力。单点的问题解决,需要编解码技术的更新,需要有应对洪峰波谷的能力,需要AI的加持。但系统性问题,需要的,则是一个所有能力的融会贯通,从生产端,到交互端,再到消费端的全链路解决方案。而这,或许正是火山引擎视频云最擅长的地方。过去Sora等技术的成熟只是点燃了0到1的火种,但AI视频真正的爆发,还需要从1到100漫长的累积。如何定义AI视频时代AI视频时代的到来理所当然,但如何定义AI视频时代,这曾是火山引擎视频云内部,一个长期的思考题。通往未来的门票,就藏在对过去历史的梳理中。经过复盘总结,火山引擎视频云认为,围绕视频,我们的时代,可以被分为三个阶段:第一阶段,信息时代。以传统的UGC短视频内容为代表,我们中的大部分都是内容的消费者,我们与视频的交互,以手机屏幕的2D体验为代表,是一个在线、双向的过程;第二阶段,到了数字时代,我们对视频品质的要求越来越高,PGC成为内容生产的主流,直播兴起带来交互上的实时、流畅、高清,而交互的空间,也从二维逐渐向三维空间过渡。这是一个生产侧内容的品质不断提升,交互侧效率不断提升,消费端交互体验与空间不断升维的过程。相应的,AI视频时代,自然也不等同于传统的数字视频时代加上AI能力,故事依旧要回到生产、交互、消费的叙事中来。首先是生产端。AI的加持,抹平了视频制作水平差距带来的鸿沟,AI辅助视频制作,逐渐成为各大软件,人人可用、人人会用的基础技能。我们不再局限于主动的内容生产与被动的内容消费,在AI视频时代,用户将成为AI原生居民,既是内容的生产者,也是消费者,更是拥有者。在这背后,则是AI技术从过去的问答,到图文交互,再到如今多模态交互,多模态内容生产的一步步跨越。而在交互端,技术的成熟,则进一步拉近了人与视频,真实世界与数字之间的连接。过去,留言的存在,让人人交互成为可能;直播等技术的兴起,通过互联网的链接,让人与人的实时交互得以实现。而以GPT-4o、火山引擎对话式AI实时交互解决方案等技术为代表,人与AI的交互,则在多模态的基础上,变得更加实时流畅、逼真与拟人。全球市场研究机构MarketsandMarkets曾做出预测,到2028年,全球AI助手市场规模将达到285亿美元。在这背后,2023—2028年的复合增长率将达到惊人的43%。消费端的这个趋势是更沉浸。以年初苹果发布的Vision Pro为代表,空间计算的新时代正式开启。在此之后,今年7月,抖音VR直播上线,9月《黑神话:悟空》以其极具震撼力的视频画面质感、跌宕起伏的剧情架构和深厚的文化底蕴,迅速吸引了全球玩家的目光。3D、虚实融合与VR技术,将成为消费端变革的主力军,架起数字世界与物理世界之间的桥梁。方向已经确认,一个新的时代就在眼前呼啸而来,接下来,火山引擎视频云的重点工作,就是去梳理在这次史无前例的市场爆发中,究竟还有多少痛点没有被解决,而火山引擎,手里又还有多少张牌。为什么是火山引擎视频云当确定了未来的大趋势,与眼前的具体困境后,接下来的故事就进入了火山引擎视频云最擅长的剧情,从生产到交互再到用户体验的全方位重构。而这一切的基础,则是框架层的创新。AI视频时代,超大规模视频训练数据集,导致了计算和处理成本激增;而伴随着视频数据质量参差不齐,数据样本的分类、分段和清洗也带来了庞大的工作量;整体处理链路涉及多个环节,工程复杂,需要多团队协作。相应地,对于视频云来说,框架不仅需要支持大模型的高效运行,还要能够满足日益复杂的音视频处理需求,以应对生成式AI时代带来的挑战。为此,火山引擎联合英特尔共同发布了BMF大模型训练视频预处理方案并升级了大模型与AI能力。BMF在本次大会上,推出了不依赖任何第三方组件的轻量化开源版本BMF-lite。通过kernel融合等创新方案,BMF-lite实现了算子加速能力,大幅提升了视频处理的效率。在通用性上,BMF-lite则提供了多平台统一的接口形式,让所有开发者都能轻松使用BMF-lite。而随着视频处理越来越从云上向端侧迁移,BMF-lite还新增了对端侧大模型的接入支持,为AI技术的融合提供了强大的支持。当前BMF-lite已经广泛地应用在了抖音的各个业务上,每天服务于上亿用户,处理视频图片万亿次。此外,应对成本挑战,火山引擎通过海量的潮汐资源和精细化的混部调度来降低单用户的平均使用成本;而为了应对质量挑战,火山引擎视频云使用多种算法对视频进行多维度的分析和筛选,在实践中沉淀了50多个算子对视频进行了精细化的过滤;对于协同挑战,火山引擎视频云利用BMF的动态模块的特性,在短时间内完成了几十个算子的集成和处理链路的开发,迭代效率相比使用传统框架提升了数倍。应对性能挑战,基于英特尔CPU等各种不同的资源,火山引擎视频云则利用BMF框架的灵活调度,将复杂的算子处理流程灵活的部署在多种资源上,并实现了快速的性能调优,提升了任务吞吐,缓解了资源瓶颈。在这背后,则是硬件在算力侧提供的稳定支持。为了应对多元的业务需求,选择不同的硬件来进行视频处理以实现最佳的性价比,是几乎所有企业都会面临的问题。英特尔强大的至强CPU处理能力,可以为8K视频实时处理、包括传统的CV视觉优化、LLM和AIGC在内的多种AI应用,各种类型业务在火山引擎上的部署,提供强大的计算支持和可靠的服务。与此同时,为了应对生成式AI时代,海量视频数据,用户高质量视频需求,不同对象丰富场景等需求,BMF还推出了灵活高效大模型训练视频预处理能力,通过视频净化、多种算子、组合输出、大规模部署等技术,目前已经在生产环境中,取得良好效果。而基于这种框架层面的创新,以及反复的内部练兵以及外部用户需求调研,针对市场痛点,火山引擎做出了三步走计划。第一步,在生产端,降低视频的生产门槛,带动AI视频时代,人人成为视频内容的消费者、生产者以及拥有者。基于这一认知,火山引擎视频云推出了多模态视频理解与生成方案,依托自研AI视频理解技术和AIGC技术,可以做到自动化提取视频高光和生成解说内容,让字幕识别错误率降低了30%。目前,该方案已探索针对短剧、赛事和直播电商的自动化解决方案。能够针对长视频进行智能拆分、高光片段提取和产出摘要描述,能够在提高人效的同时保证内容的精准传达。同时,结合AIGC技术生成视频素材,创作者可以快速完成预告片的视频生产,能够显著缩短制作周期并降低成本。为了让内容生成更加丰富有趣,火山引擎视频云还落地实践了多模态营销素材生成方案,通过融合图像分析、AIGC(人工智能生成内容)、大模型处理、3D物体重建等先进技术,实现了商品氛围图、图文视频、解说视频、AIGC视频和3D商品模型等多模态营销素材的自动化生产。目前,这些创新服务已经支持自营电商智能氛围图的端到端自动化托管,并且在电商场景的核心指标上取得了显著提升。当然,这种生产端的升级,并不止于视频画面,声音技术的升级同样重要。火山引擎视频云通过采用了自研的豆包语音大模型,实现了高品质多语言声音复刻,并利用虚拟人技术调整演讲者口型,让观感更加自然。而在交互端,火山引擎视频云则推出了对话式AI实时交互解决方案,通过火山引擎豆包大模型和视频云RTC技术实现了语音数据的高效采集、处理和传输,并在服务端,并为用户提供了智能对话和自然语言处理的强大能力,毫秒级人声检测和打断响应,以及丝滑稳定的端到端响应体验。当前,这一方案已经广泛应用于智能助手、AI陪伴、AI教育、智能客服等场景,并为用户带来更自然、流畅和真实的人机交互体验。框架的建构,解决了生产端的效率;交互的革新,带来了产品体验的进一步升级,AI视频时代的未来已经初见雏形,但要让全链路的升级更加完整,还差最后一步——消费端的沉浸式体验升级。今年以来,随着《黑神话:悟空》爆火,带动3D生成和场景重建技术兴起,火山引擎视频云推出了基于AI的3D生成方案,借助大模型强大的生成能力,采用基于图生3D的模式来完成3D内容的快速构建。同时,火山引擎视频云还上线了高质量3D Gaussian-Splatting场景重建及低延迟重渲染方案,用于对场景进行高质量的几何、外观重建和渲染,并实现行业内首个高斯方案支持复杂的实时重打光及阴影渲染。目前,该技术已经实际应用在虚拟直播等VR/AR/XR应用中,相比传统的手工3D建模,在效率、多样性和操作成本等方面具备明显优势。一定程度上,AI视频时代,技术只是引爆一切的起点,但真正的商业化,则需要以用户的体验为核心,从框架到场景,从生产到交互再到消费端的全方位发力,市场也随之进入马拉松长跑阶段。火山引擎视频云,为这场长跑的下半场,做了一次不错的探索。本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com

koa12jJid0DL9adK+CJ1DK2K393LKASDad

编辑:贾怡

TOP1热点:24-25 赛季英超联赛英超第 21 轮阿森纳 2:1 热刺,如何评价这场比赛?

当事人应当在接到本处罚决定书之日起十五日内持缴款码到财政部指定的代理银行进行缴款。逾期,将每日按罚款数额的百分之三加处罚款。(缴款码将在处罚决定书送达时告知。)。

多位催收行业人士呼吁,国内催收行业需要立法。一位催收公司高管对界面新闻说:“现有法律保护了欠款人的权益,却没有保护催款人的权益。”

TOP2热点:1 月 16 日安徽合肥市肥东县发生 3.7 级地震,哪些地方有震感?

在业内人士看来,券商账户管理功能的不断优化对赋能业务创新、提升管理效率、优化客户体验、锻造竞争优势等都意义重大。综合账户试点功能的推出与完善是对客户账户管理服务体系的全面升级。在此基础上衍生出的“账户+服务伴随客户成长”模式,有助引导投资者合理规划自身资产结构,推动财富管理理念的转型。

新浪科技讯,6月20日中午消息,据阿里内部人士透露,其公司已收到内部信,蔡崇信接替成为阿里巴巴集团董事会主席。

TOP3热点:中美两国网友对账医疗,中国医疗的服务和费用让美网友破防,双方医疗体系到底有何不同?打开扇贝就可以吃火腿肠视频

文/田浩洋——专业国际市场点评,针对实际市场参与者,考虑到部分市场窗口对于实盘交易具有一定的时效性可关注笔者,从而能够选择合适的策略进行操作。对黄金、

“催收行业良莠不齐,确实存在暴力催收、频繁骚扰债务人等问题,也出现过一些比较恶劣的刑事案件,目前行业有污名化的趋势。但催收从业务本质上来说,是贷后管理的重要内容,催收本身也是一个很古老的行业。”该负责人表示,当前需要制定标准来指导金融机构和第三方催收机构应该怎么做,也让债务人知晓自己有哪些责任和权利,明晰各方边界。

TOP4热点:如何看待网传弦论大会 (string conference) 2026 年无人承办?欧亚尺码专线欧洲b1b1

据报道,已有114家央行处于CBDC探索的某个阶段,“其中约有10家已经越过了终点线,”格奥尔基耶娃说,“如果各国开发CBDC只是为了国内部署,我们就不能充分利用它们。”

两年后,谭曼加入广东信孚律师事务所,以律所金融业务部负责人的身份为客户处理资金信誉管理、财产安全保护等法律问题。

TOP5热点:SpaceX 星舰第七次试飞二级失联后解体,一级再度上演「筷子夹火箭」回收,还有哪些信息值得关注?啊⋯啊⋯啊⋯快⋯高潮了口述

文/田浩洋——专业国际市场点评,针对实际市场参与者,考虑到部分市场窗口对于实盘交易具有一定的时效性可关注笔者,从而能够选择合适的策略进行操作。对黄金、

1996年4月,联邦陪审团对卡钦斯基提出了10项非法运输、邮寄和使用炸弹的指控,以及3项谋杀指控。1998年1月21日,卡钦斯基通过辩诉交易,与检察官达成了认罪协议。他承认了所有的指控,接受了终身监禁且不得假释的刑罚,逃过了死刑。

TOP6热点:为什么有的人特别容易紧张?公啊〜好〜嗯〜轻一点电影

香港券商员工能否炒股?

“鼠头鸭脖”涉事企业为江西中快母公司经营全国700多个高校食堂,东方网,2023-06-19

TOP7热点:AI 客服使用场景逐渐丰富,多地却将「人工客服」列为急需人才,这暴露出哪些问题?该如何弥补这样的缺口?696969大但人文艺术主题

为何违规炒股屡禁不止?抱有侥幸心理、背后利益驱使、合规意识淡薄、处罚相对较低四点原因可以很好地予以概括。

青山不改,绿水长流,创造一个新的江湖,再相会,任逍遥!

TOP8热点:全球越来越多高校的化学专业正在消失,背后原因有哪些?理科进入危机时代的背后蕴藏着哪些问题?日本护士体内she精3XxX

在农村地区,结合乡村级充电网络建设和输配电网发展,加快在大型村镇、易地搬迁集中安置区、乡村旅游重点村镇等规划布局充电网络,大力推动在乡镇机关、企事业单位、商业建筑、交通枢纽场站、公共停车场、物流基地等区域布局建设公共充电基础设施。

白酒板块自今年年初以来,已有一定幅度调整,目前较2月高点已跌去约20%。不少机构认为,前期悲观主要来源于当下弱动销复苏反馈,市场整体预期较低,但全年来看,行业集中度提升趋势不改,优质酒企份额持续提升,价增长期仍有空间。

TOP9热点:心理咨询与聊天的核心区别是什么?心理咨询真的有用吗?18+触摸互动游戏+黄油像素

连锁经营专家文志宏告诉中国新闻周刊,由于团餐偏刚需的属性,近几年发展速度明显高于社会餐饮。

大家都知道,云计算、大数据和人工智能等核心技术的发展将会给社会带来巨大的变革,战略意义非常重大。目前云智能集团的完全分拆工作已经开始启动,正处于最关键时刻,要求必须全身心投入其中,同时也是考虑到分拆过程中公司规范化治理的要求,我个人不宜再同时担任两家集团的董事长和首席执行官的职责。因此,阿里巴巴集团董事会讨论并接受了我的请求:自2023年9月10日起,我将不再继续担任阿里巴巴集团董事会主席和首席执行官,而专心全职做好阿里云智能集团董事长兼首席执行官的工作。同时,阿里巴巴集团董事会决定,蔡崇信(JoeC.Tsai)将接替我成为阿里巴巴集团董事会主席,吴泳铭(EddieYongmingWu)将接替我成为阿里巴巴集团首席执行官。他们两位都是阿里巴巴的创始人和合伙人,都在阿里巴巴集团历史发展中做出了重要贡献,都拥有丰富的经验,相信在他们的领导下,公司能够走向更辉煌的未来。

TOP10热点:任天堂 Switch 2 首支预告片公开,视频中有哪些细节值得关注?小s货又想挨c了叫大声点小

为何违规炒股屡禁不止?抱有侥幸心理、背后利益驱使、合规意识淡薄、处罚相对较低四点原因可以很好地予以概括。

家用电器板块涨幅居前,

发布于:合肥蜀山区