精东影业腾讯精东影业版“Sora”加入文生视频战场_ZAKER新闻
腾讯精东影业版“Sora”加入文生视频战场_ZAKER新闻
另据《日本经济新闻》1月报道,松下控股正在中国加快投资步伐,将在2022年至2024年三年时间里投入超过500亿日元,在中国新建或扩建10座以上家电及空调设备工厂。此次投资被视为2000年以来松下对中国家电及家居设备业务实施的最大规模投资。
作者 | 黄昱编辑 | 周智宇年初," 文生视频 " 模型 Sora 的出现,掀起了全球竞逐 AI 视频生成的热潮;近 10 个月过去,Sora 迟迟没有对外开放,而作为后来者的腾讯混元,抢先加入了这一战场。12 月 3 日,腾讯混元大模型正式上线视频生成能力,C 端用户通过腾讯元宝 APP 就可申请试用,企业客户通过腾讯云提供服务接入,目前 API 同步开放内测申请。把文生视频摆上牌桌,这是继文生文、文生图、3D 生成之后,腾讯混元大模型的又一新里程碑。与此同时,腾讯开源该视频生成大模型,参数量 130 亿,是当前最大的视频开源模型。据华尔街见闻了解,腾讯混元的视频生成几乎没有门槛,用户只需要输入一段文字描述,腾讯混元生成视频大模型就可以生成一段五秒的视频。相较于 Sora 分钟级别以及一些 " 类 Sora" 产品 10s 的视频生成时长,腾讯混元的视频生成时长不太让人振奋。在当日的媒体沟通会上,腾讯混元多模态生成技术负责人表示,视频时长不是技术问题,而是纯算力和数据问题,因为时间扩长一倍,它的算力是一个平方级的上升,所以不是很划算。此外,他指出,大部分人用视频的情况下都是一个镜头接一个镜头,所以混元视频生成模型第一版先放 5s 时长的出来,优先满足大部分的需求。" 未来如果大家有很多强烈需求,要做很长的一镜到底,我们再去做升级。"腾讯混元生成视频目前主要呈现四大特点:写实画质、语义遵从、动态流畅、原生转场。在技术路线上,腾讯混元视频生成模型选择了跟 Sora 类似的 DiT 架构,并在架构设计上进行多处升级,包括引入多模态大语言模型作为文本编码器、基于自研 Scaling Law 的全注意力 DiT、自研 3D VAE 等。腾讯混元多模态生成技术负责人指出,混元算是业内首个或者特别少数拿多模态大语言模型来做文本编码器的视频生成模型。业界现在更多还是选用 T5 模型和 CLIP 模型作为文本编码器。之所以这样选择,是因为腾讯混元是看中了这条技术路线的三大优点,包括增强复杂文本的理解能力、原生图文对齐能力以及支持系统提示词。此外,腾讯混元多模态生成技术负责人提到,在做 GPT 之前,OpenAI 花了很多心思去验证 Scaling Law(用更多的数据训练更大的模型)在语言模型中的有效性,但在视频生成领域学术界或业界没有把 Scaling Law 是否有效公开出来。在此背景下,腾讯混元团队自己把图像、视频生成的 Scaling Law 验证了一边,最终得出结论,图像 DiT 有,视频基于图像 DiT 做二阶段的训练一样是有 Scaling Law 的性质在的。" 所以我们首版腾讯混元视频生成模型是基于这套比较严格的 Scaling Law 的推论,做了一个 130 亿的模型。" 腾讯混元多模态生成技术负责人说道。与此同时,腾讯混元也在疾行视频生成生态模型的探索,包括图生视频模型、视频配音模型、驱动 2D 照片数字人等。腾讯混元多模态生成技术负责人指出,相较于文生视频,图生视频模型在可用性的推进上进展会更快,可能在不到一个月之内混元会发布最新进展。自去两年前 ChatGPT 掀起的 AI 大模型热潮以来,大语言模型技术路径已收敛,而视频生成模型仍处于探索期。东方证券分析师指出,在 OpenAI 的技术方向引领下,目前语言模型的技术路径基本就是 GPT 这一条路。而多模态技术方面,目前没有一家公司处于绝对领先地位,技术路径仍存在探索的可能。腾讯混元多模态生成技术负责人也表示,文生视频整体都处于不太成熟的阶段,综合合格率都不高。作为多模态生成中难度最大的领域,视频生成对算力、数据等资源要求较高,目前相较于文本、图像成熟度更低,同时面临商业化、产品化进展较慢的挑战。OpenAI 也宣布由于算力短缺而推迟 Sora 的更新,导致至今尚未对外开放。尽管如此,为了更快抢占市场,去年十一月以来,视频生成领域的成果密集落地。截至目前,国内外不少大模型厂商都实现了类 Sora 产品落地,包括国内 MiniMax、智谱、字节、快手、爱诗科技等,海外 Runway、Pika、Luma。不过,由于算力和技术等因素,视频生成时长一般在 10s 以内。为了推进商业化,大模型厂商必须找到更多视频生成的应用场景。这次,腾讯给出的思路是:混元视频生成模型画面具备高质感,可用于工业级商业场景例如广告宣传、动画制作、创意视频生成等场景。视频 AI 是多模态领域的最后一环,也是更容易催生爆款应用的领域,但如何在算力投入与商业化之间缺的平衡,依然是目前 " 类 Sora" 的视频生成模型们必须解决的一大难题。koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:李厚福
TOP1热点:2024年税务部门查处2722户加油站
据印尼媒体报道,印尼政府因应台海紧张情势升温,已经拟定“撤侨”计划,可能撤离在台湾的35万名印尼公民。有岛内舆论指出,印尼是台湾外籍劳工主要来源地区之一,出现这种情况完全是蔡英文执政的结果。。
国家发改委国土开发与地区经济研究所综合研究室主任贾若祥对中国新闻周刊表示,在中国人口规模整体呈现负增长的大环境下,沈阳若要迈入千万人口队列,人口自然增长贡献已变得非常有限。
TOP2热点:郑钦文黑长裙亮相晚宴
1998年,为给国际干旱区自然资源开发、生态修复、环境治理等提供科学支撑,中国科学院新疆生态与地理研究所成立。李生宇是该研究所一名正高级工程师,2018~2020年,他牵头执行了一个国际科技合作项目,名为“中蒙草场荒漠化防治技术合作研究与示范”,并于2019年多次前往蒙古国开展调研和试验研究。
TOP3热点:韩媒称韩国队犯规判罚有争议504 Gateway Time-out
[环球时报驻俄罗斯特约记者 李琳佳 环球时报记者 郭媛丹 刘煊尊 柳玉鹏]应俄罗斯国防部长绍伊古的邀请,中国国务委员兼国防部长李尚福上将4月16日开始对俄罗斯进行履新后的首次正式访问。俄罗斯国防部称:“这是他自2023年3月被任命为中国国防部长以来的首次外访。访问期间,俄罗斯国防部长绍伊古将军计划与中国国防部长举行会谈。双方将讨论双边国防合作的现状和前景,以及当前的全球和地区安全问题。”
服务业也已经成为中国外商投资的另一大去处。据AgeLifePro统计,截至2020年底,已有至少11个国家和地区的40家公司进军中国养老市场,遍布17个省份,已建成44个项目。
TOP4热点:安东尼:詹姆斯不可能提前知道交易👙mofos👙فىلىم.
国家发改委国土开发与地区经济研究所综合研究室主任贾若祥对中国新闻周刊表示,在中国人口规模整体呈现负增长的大环境下,沈阳若要迈入千万人口队列,人口自然增长贡献已变得非常有限。
TOP5热点:日本政府债务达1317万亿日元创新高一面亲膜上边一面膜下边日本
在这个过程中,季女士看到几辆消防车呼啸而过,随后救护车也赶到了。“好多119的车,一直往这边开。”她告诉记者,现场来了很多消防员,架起云梯搭救站在窗户边的人,一直往外面运人。
TOP6热点:汇隆新材拟投建印尼生产基地钢钢钢钢钢钢钢好多水mba
“中国是令人振奋的投资热土,也是全球经济摆脱低迷的强劲引擎。中国市场对我们来说是最大的市场,也是一个非常特殊的市场,而且在创新方面也是领先者。”安利全球CEO潘睦邻在CDF年会说。不少外企高管也表示,这是他们近3年来首次访问中国,期待在中国能挖掘新的合作机遇。
TOP7热点:朱孝天:我不想吃人血馒头是谁给你开的花苞啊诗爸爸
此外,CDF年会期间,工信部党组书记、部长金壮龙会见了宝马、博世、博通、康宁、梅赛德斯-奔驰、辉瑞、施耐德电气、西门子等跨国企业负责人。国家发改委、银保监会、国家市场监督管理总局、国务院国资委等部门主要负责人也会见了部分外资企业代表。这些部门在会谈时均强调,坚定不移推进高水平对外开放,并表示将为外资企业在华发展提供服务和保障。
32岁的北京人韩彬也注意到,更早先几年,北京春天很少受到沙尘暴的侵扰。他将这种好天气归功于中国的治沙成就。当近两三年北京等城市再次遭遇沙尘暴时,一些人提出疑问:这些年来的植树造林为何没能挡住沙尘暴?
TOP8热点:温州一家五口驾车坠崖致1死把八重神子焯出白水怎么办
在他看来,如果这样一个观光缆车建成的话,对上海的旅游会有很大的提升。“相信这样一个构想实现以后,能够成为上海的另外一个地标。”他说。
TOP9热点:郑永刚遗孀周婷 压力山大同学叫我去他家然后把门锁了
“非要学重庆,人家重庆市两边有山,地形复杂,上海都是平原。”一位网友表示。还有人担心,“这个跨度真的实现得了吗?”“台风天怎么办?”
TOP10热点:11岁小孩姐造假人逃避背书嫦娥狂飙乳液奖励自己一发
而在东北地区人口持续负增长的大背景下,沈阳市依靠系列人才引进政策、改善营商环境、降低落户门槛等措施实现了人口逆势增长。其常住人口从2016年的860.9万人增长到2022年的914.7万人,六年间增长了约53.8万人。
近段时间,政府多次表态,新政频出。不少外企负责人告诉《中国新闻周刊》,他们将继续投资中国。目前,来华名单还在拉长,投资项目还在扩充,“下一个中国”还在中国。