2024-02-19日消息
-
【申万传媒】OpenAI发布文生视频模型Sora,AI视频向商业化大步迈进。(可能是今天的最热方向,建议重视)
Sora性能:#1)视频时长现象级扩展:可达到60秒,且并非多个3-4s视频的拼接,连贯性强;
#2)更强的一致性:物体形状、场景风格保持出色,可实现多镜头切换,不再局限于单镜头视频生成;
#3)逼真程度再上一台阶:相比PIKA、Runway,Sora生成视频在人物手部动作、面部表情、动物眨眼等高难度内容上表现大幅提升。
#4)采样灵活性:可根据设备的原生宽高比创建内容。
技术:1)将视频和图像编码成潜在代码,分解成包含时间和空间信息的Patches,利于模型训练,可类比LLM中的Token;2)语言理解:使用了DALL-E 3中的重述技术,将视觉训练数据生成高精准描述性的字幕,提高语意理解能力。
OpenAI坦言Sora目前仍存在局限性,如难以准确地模拟复杂场景的物理属性,玻璃破碎;也可能无法理解因果关系的具体实例;混淆提示的空间细节,如左右等。
OpenAI尚未公开开放Sora权限。
我们预计AI视频对视频行业(场景包括泛娱乐、广告、新闻等等)将产生巨大影响,一方面降低视频内容生产制作门槛,另一方面创意、IP的价值会更高;同时算法、算力等技术公司也有往参与分享产业链价值。此外,UGC视频的质量将进一步提升,过去UGC视频多为15s短平快的视频,有了AI视频工具助力,一分钟以上的微电影社区指日可待。
关注有一定安全边际的公司,包括有丰富IP储备的上海电影、阅文集团、华策影视;有丰富应用场景的美图、易点天下、焦点科技
(观点供参考,投资需谨慎)