大模型进化速度超预期 AI视频生成迎来“GPT时刻”
中证网讯(记者 康曦)2月18日,国海证券发布研报称,Sora的推出,体现出大模型进化速度的超预期,这或将是通往AGI(通用人工智能)时代的里程碑。国内大模型将受益于海外技术交流和开源,国产大模型多模态和通用能力将追赶GPT4-turbo和Sora等。
近日,OpenAI推出全新的文生视频大模型Sora,AI视频生成迎来“GPT时刻”。在Open AI公布的48个样片中,Sora展现出令人惊叹的视频生成效果,视频时长提升至1分钟,生成的角色表情逼真,还实现了多角度镜头切换与流畅分镜,可展现真实光影、运动和镜头移动效果。
Sora是一个扩散Transformer模型,通过采用Diffusion Transformer等技术处理不同持续时间、分辨率和比例的视频/图像,实现“世界模拟器”,达到理解真实世界的运动和物理能力。
业内人士表示,世界模拟器是AI生成视频的一种方式,它的成功会带动视频生成赛道的发展,加速视频生成的创新和成熟。
面对AI视频生成领域的广阔前景,国内各厂商正加大投入,推动AI视频生成进入全新时代。字节跳动于去年11月发布PixelDance模型,不仅在视频时长上实现了突破,还可通过描述(纯文本)+首帧指导(图片)+尾帧指导(图片),生成包含复杂场景和动作的视频,用上一个视频片段尾帧为下一个视频头帧提供指导思路。
万兴科技于今年年初推出国内首个以音视频为核心的多媒体大模型万兴“天幕”。定位上,万兴“天幕”是音视频多媒体创作垂类大模型,由视频、音频、图片、语言大模型组成;能力上,万兴“天幕”涵盖当前市面上语言、音频、图像的大模型能力,文生视频能力是万兴“天幕”的子能力之一;用户方面,万兴“天幕”面向更细分垂直的市场,包括泛知识、泛营销、泛娱乐等领域,相关能力已在海外规模化商用。
AI视频生成赛道前景广阔。数据显示,截至2023年末,仅国内短视频用户规模就已突破10亿人。
在业内人士看来,Sora是AGI(通用人工智能)实现的重要里程碑,Sora的出现将全球目光聚焦于视频生成领域,验证了视频为王的趋势,也进一步验证了无视频不传播的时代,“视频+大模型”的应用市场空间不断扩展。
日前,国泰君安证券发布研报称,Sora模型推动AI多模态领域飞跃式发展,AI创作等相关领域将迎来深度变革,AI赋能范围进一步扩大,推荐万兴科技、金山办公、科大讯飞、虹软科技等标的。