交换的日子2腾讯版“Sor交换的日子2a”加入文生视频战场_ZAKER新闻
腾讯版“Sor交换的日子2a”加入文生视频战场_ZAKER新闻
这种隔膜常应用于动力锂电池,终端应用多为新能源汽车和小型电动车等。
作者 | 黄昱编辑 | 周智宇年初," 文生视频 " 模型 Sora 的出现,掀起了全球竞逐 AI 视频生成的热潮;近 10 个月过去,Sora 迟迟没有对外开放,而作为后来者的腾讯混元,抢先加入了这一战场。12 月 3 日,腾讯混元大模型正式上线视频生成能力,C 端用户通过腾讯元宝 APP 就可申请试用,企业客户通过腾讯云提供服务接入,目前 API 同步开放内测申请。把文生视频摆上牌桌,这是继文生文、文生图、3D 生成之后,腾讯混元大模型的又一新里程碑。与此同时,腾讯开源该视频生成大模型,参数量 130 亿,是当前最大的视频开源模型。据华尔街见闻了解,腾讯混元的视频生成几乎没有门槛,用户只需要输入一段文字描述,腾讯混元生成视频大模型就可以生成一段五秒的视频。相较于 Sora 分钟级别以及一些 " 类 Sora" 产品 10s 的视频生成时长,腾讯混元的视频生成时长不太让人振奋。在当日的媒体沟通会上,腾讯混元多模态生成技术负责人表示,视频时长不是技术问题,而是纯算力和数据问题,因为时间扩长一倍,它的算力是一个平方级的上升,所以不是很划算。此外,他指出,大部分人用视频的情况下都是一个镜头接一个镜头,所以混元视频生成模型第一版先放 5s 时长的出来,优先满足大部分的需求。" 未来如果大家有很多强烈需求,要做很长的一镜到底,我们再去做升级。"腾讯混元生成视频目前主要呈现四大特点:写实画质、语义遵从、动态流畅、原生转场。在技术路线上,腾讯混元视频生成模型选择了跟 Sora 类似的 DiT 架构,并在架构设计上进行多处升级,包括引入多模态大语言模型作为文本编码器、基于自研 Scaling Law 的全注意力 DiT、自研 3D VAE 等。腾讯混元多模态生成技术负责人指出,混元算是业内首个或者特别少数拿多模态大语言模型来做文本编码器的视频生成模型。业界现在更多还是选用 T5 模型和 CLIP 模型作为文本编码器。之所以这样选择,是因为腾讯混元是看中了这条技术路线的三大优点,包括增强复杂文本的理解能力、原生图文对齐能力以及支持系统提示词。此外,腾讯混元多模态生成技术负责人提到,在做 GPT 之前,OpenAI 花了很多心思去验证 Scaling Law(用更多的数据训练更大的模型)在语言模型中的有效性,但在视频生成领域学术界或业界没有把 Scaling Law 是否有效公开出来。在此背景下,腾讯混元团队自己把图像、视频生成的 Scaling Law 验证了一边,最终得出结论,图像 DiT 有,视频基于图像 DiT 做二阶段的训练一样是有 Scaling Law 的性质在的。" 所以我们首版腾讯混元视频生成模型是基于这套比较严格的 Scaling Law 的推论,做了一个 130 亿的模型。" 腾讯混元多模态生成技术负责人说道。与此同时,腾讯混元也在疾行视频生成生态模型的探索,包括图生视频模型、视频配音模型、驱动 2D 照片数字人等。腾讯混元多模态生成技术负责人指出,相较于文生视频,图生视频模型在可用性的推进上进展会更快,可能在不到一个月之内混元会发布最新进展。自去两年前 ChatGPT 掀起的 AI 大模型热潮以来,大语言模型技术路径已收敛,而视频生成模型仍处于探索期。东方证券分析师指出,在 OpenAI 的技术方向引领下,目前语言模型的技术路径基本就是 GPT 这一条路。而多模态技术方面,目前没有一家公司处于绝对领先地位,技术路径仍存在探索的可能。腾讯混元多模态生成技术负责人也表示,文生视频整体都处于不太成熟的阶段,综合合格率都不高。作为多模态生成中难度最大的领域,视频生成对算力、数据等资源要求较高,目前相较于文本、图像成熟度更低,同时面临商业化、产品化进展较慢的挑战。OpenAI 也宣布由于算力短缺而推迟 Sora 的更新,导致至今尚未对外开放。尽管如此,为了更快抢占市场,去年十一月以来,视频生成领域的成果密集落地。截至目前,国内外不少大模型厂商都实现了类 Sora 产品落地,包括国内 MiniMax、智谱、字节、快手、爱诗科技等,海外 Runway、Pika、Luma。不过,由于算力和技术等因素,视频生成时长一般在 10s 以内。为了推进商业化,大模型厂商必须找到更多视频生成的应用场景。这次,腾讯给出的思路是:混元视频生成模型画面具备高质感,可用于工业级商业场景例如广告宣传、动画制作、创意视频生成等场景。视频 AI 是多模态领域的最后一环,也是更容易催生爆款应用的领域,但如何在算力投入与商业化之间缺的平衡,依然是目前 " 类 Sora" 的视频生成模型们必须解决的一大难题。koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:李大江
TOP1热点:崔茂虎奢靡享乐!牌瘾大到毫不避讳
“策略之王”发现,浪潮软件出现阳包阴的同时,股价站上5日均线,表示短期多方强势,上涨信号得到了进一步的确认。。
TOP2热点:林诗栋入选世界乒联年度十佳球
近期,房地产市场的持续低迷让行业雷声不断,在恒大自曝超万亿元负债后,曾多年蝉联行业第一的碧桂园也声称现阶段出现流动性困难。
引入战投时公司估值为75亿,此次上市时公司市值为400亿,截止8月4日收盘公司市值为571亿,8年增值达8倍,实控人夫妇身价达78亿,简直赢麻了。
TOP3热点:孟子义回应请李昀锐上桃花坞成免费的crm
突然之间,通胀警报再次响起。最近天然气价格的波动凸显了供应中断对近期较为温和的通胀动态的持续风险。
TOP4热点:女子称用定位在野外找到遗失手机男的突然变得很快是为什么
派能电池是上市公司派能科技(688063.SH)的全资子公司,穿透发现,派能科技的控股股东中兴新通讯有限公司(下称“中兴新”),同时也是中兴新材的最大股东。
TOP5热点:25岁理发师双手与脸形成巨大反差暴躁少女CSGO
投资要点
TOP6热点:新赛季中超首个转会窗口开启肌肌桶肤肤30分钟软件大全
来源:金角财经
对于消费贷的资金流向,《关于恢复和扩大消费的措施》中明确提出“更注重以
TOP7热点:祝绪丹听丁禹兮获奖感言哭了人畜禽CROPROATION
责任编辑:宋源珺
TOP8热点:郑钦文成今年澳网5号种子HDHDHDXX18
当百度、小米等互联网公司纷纷下场造车,新能源汽车的战争愈演愈烈。对于跨界搅局者,李想直言汽车要拿产品说话,并称汽车销量无法造假,最后发展如何,还要看最后的产品如何。
“策略之王”发现,兆新股份出现阳包阴的同时,股价站上5日均线,表示短期多方强势,上涨信号得到了进一步的确认。
TOP9热点:小狗送别空难去世的9位家人乐可全文番外TXT百度免费下载
此后,李想创立的新能源汽车品牌理想脱颖而出,与蔚来汽车、小鹏汽车并称造车新势力三剑客。
声明:数据宝所有资讯内容不构成投资建议,股市有风险,投资需谨慎。
TOP10热点:谭卓:我于行业总像个“局外人”你看你奶奶啵啵那么大是什么歌
另外,景顺第二季度建仓了满帮(YMM.US)、