美图吴欣鸿:视频大模型处于2.0阶段 将全力推进大模型视频能力

美图吴欣鸿:视频大模型处于2.0阶段 将全力推进大模型视频能力

来源:中国日报网     2024-03-29 18:11
来源: 中国日报网
2024-03-29 18:11 
分享
分享到
分享到微信

3月28日,第十一届中国网络视听大会在成都举行,美图公司创始人、董事长兼首席执行官吴欣鸿发表主题演讲《视频大模型如何助力网络视听创作》。

本届大会以“极视听强赋能”为主题,有2000余家业内企业和机构、5000余位行业代表、近万名嘉宾共赴盛会。

今年年初,Sora的亮相引发了视频生成领域的风潮。吴欣鸿透露,目前美图公司正紧锣密鼓进行视频模型的更新和迭代,准备在视频生成领域大展拳脚。

大会现场,吴欣鸿展示了一支主题为“动物疯狂赛车”的60秒视频。

这支视频基于美图视觉大模型MiracleVision(奇想智能)的图像生成、视频生成能力。具体来说,它使用了开拍的“AI脚本”、“AI数字人”功能,WHEE的“文生图”、“AI生视频”功能,Wink的“视频编辑”功能,仅用半天就完成了故事脚本、分镜设计、视频生成、唇形同步、视频编辑等视频制作流程。

“以Sora为代表的视频大模型只是开始。”在吴欣鸿看来,目前只是视频大模型的2.0阶段,以Sora为代表的视频大模型正在尝试理解世界,具有一定涌现能力,能够生成30-60秒的视频。

吴欣鸿认为,在视频大模型3.0阶段,可以实现更丰富的物理运动,视频大模型也将具备剧情设计、分镜、转场等能力,值得用户和行业期待。

谈及视频垂直场景,吴欣鸿认为,视频垂直场景与AI原生工作流的结合,在AI视频生成、AI视频编辑、AI视频渲染等领域有巨大应用机会。美图正在上述领域进行创新探索,新产品将在今年6月的美图影像节上亮相。

自2014年起,美图公司通过美图秀秀、Wink、开拍等一系列影像工具,持续助力网络视听内容创作。目前,Wink已进入中国视频编辑赛道前三名,开拍已成为口播博主的新宠。

截至2023年12月,我国网络视听用户规模达10.74亿。2023年网络视听市场规模首次突破万亿元。

针对网络视听的内容生产和产业发展,吴欣鸿表示,美图公司将全力推进自研大模型的视频能力,为网络视听行业提供更优质的视频创作工具。

【责任编辑:张瑨瑄】
中国日报网版权说明:凡注明来源为“中国日报网:XXX(署名)”,除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系;凡本网注明“来源:XXX(非中国日报网)”的作品,均转载自其它媒体,目的在于传播更多信息,其他媒体如需转载,请与稿件来源方联系,如产生任何问题与本网无关。
版权保护:本网登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网(中报国际文化传媒(北京)有限公司)独家所有使用。 未经中国日报网事先协议授权,禁止转载使用。给中国日报网提意见:rx@chinadaily.com.cn