影片创作迎来新纪元!SkyReels-V2 和 A2 双剑合璧,打破时长壁垒,赋予镜头魔法。用 AI 技术演绎无限创意,让每一帧画面都栩栩如生,低成本打造电影级视觉盛宴。
当前 AI 视频生成领域,普遍面临诸多困境:模型大多数不开源,视频生成长度最多10秒,剧情还没开始就结束了;用户难以二次开发与深度定制;效果一言难尽,让它来个王家卫风格的逆光特写,结果呢,给你整出个表情包;使用门槛高,普通创作者难以驾驭;操作复杂,上手难度大。此外,这些闭源模型的使用成本居高不下,对于预算有限的创作者和团队来说,无疑是巨大的障碍。
全球首个开源 SOTA 无限时长电影级视频的 AI
在 AI 视频生成领域,昆仑万维再次引领行业潮流,继年初开源 SkyReels-V1、A1 后,持续迭代,近期重磅推出 SkyReels-V2 和 SkyReels-A2 两大模型,为创作者带来前所未有的创作自由和强大的技术支持。其中,SkyReels-V2 作为全球首个开源的 SOTA 级无限时长电影级视频生成模型,彻底打破了传统视频生成的时长限制,让创作者能够随心所欲地构建长镜头叙事,为影视创作开辟了全新的可能性。
SkyReels-V2 的核心在于其独特的技术架构和训练方法。它通过多模态大语言模型(MLLM)和子专家模型的结合,精确理解视频内容的结构化描述,包括主体类型、外观、动作、表情、位置等多维度信息,以及镜头类型、角度、位置和相机运动等专业电影元素。这种结构化字幕的设计,使得视频生成能够精准遵循提示词,确保创作意图得到完美呈现。
此外,SkyReels-V2 采用渐进式分辨率预训练和多阶段后训练策略,逐步提升视频生成的质量。从低分辨率的基础训练到高分辨率的精细微调,每一个阶段都经过严格的优化,确保生成视频在视觉质量、动态效果和时长上的卓越表现。而其创新的扩散强迫框架,通过非递减噪声安排,让视频内容能够无限延伸,实现了真正的无限时长电影级视频生成。
SkyReels-V2 通过自研的高质量数据清洗和人工标注管线,构建了千万级的高质量电影、电视剧、纪录片数据。这不仅确保了模型在人物微表情、肢体动作、场景描述、光影、画面构图等方面的精准理解与生成,还使模型在各项指标上达到了开源 SOTA 级别。如在人物表情生成方面,SkyReels-V2 支持 33 种细腻人物表情与 400 多种自然动作组合,高度还原真人情感表达,生成的视频中人物表演细节丰富且精准。在场景生成方面,基于好莱坞级的高质量影视数据训练,SkyReels-V2 生成的每一帧画面在构图、演员站位、相机角度等都具备电影级的质感。在权威评测基准V-Bench 1.0和自建SkyReels-Bench中,SkyReels-V2展现了全面优势:
SkyReels-A2 则专注于多元素视频生成任务,能够将多个视觉元素(如人物、物体、背景)根据文本提示精确地组合成连贯自然的视频。它通过精心设计的数据管道构建文本 - 参考图像 - 视频三元组,利用图像 - 文本联合嵌入模型,将多元素表示注入生成过程,平衡元素特定的一致性与全局连贯性以及文本对齐。
在架构上,SkyReels-A2 采用双流结构处理参考图像,分别提取语义特征和空间特征,并通过交叉注意力层和通道拼接的方式,将这些特征融入到视频扩散模型中。这种设计不仅保留了每个参考元素的保真度,还确保了场景的整体连贯性和自然输出。
说了这么多,我还是想动手体验一下SkyReels的视频创作能力,目前这两大模型已被融入到SkyReels官网:https://www.skyreels.ai/
开始创作之前,用户需要在 SkyReels 官方网站注册账号并登录,以获取免费的创作额度。对于需要更高创作质量和速度的用户,平台还提供了升级计划,可享受更强大的功能和更快的生成速度。
用户可以选择使用 SkyReels-V2 进行电影级视频创作。点击 AI Video 即可直接创作AI 视频:在平台上输入详细的文本提示词,描述视频的主题、情节、人物、动作、场景等关键信息。然后,根据需要选择视频的时长、分辨率和风格等参数。点击生成按钮后,SkyReels-V2 将基于提示词和参数,自动生成高质量的视频。这是用SkyReels创作的一个30秒视频,仅供欣赏:
除了可以创作长达30秒的视频外,我更感兴趣的是短剧创作,作为一个零经验的技术人员,体验了一把20分钟创作一部短剧的乐趣。
选择 AI Drama,点击 Create,进入的AI短剧的创作页面,SkyReels给了一个自动生成的英文小说剧本:
看起来是一个关于程序员的爽文故事,就直接使用了,然后点击右上角的“Generate Script",SkyReels帮我自动生成了一个AI 小说剧本:
翻译了一下大概是:
总结 在城市小巷中,艾斯琳格利用她的专长黑入阿德里安的安保系统,揭露企业机密。与此同时,浑然不觉的阿德里安在企业办公室与罗斯讨论安保漏洞,而罗斯怀疑 “Vixen” 的介入。
剧本外景:城市小巷——夜晚 狭窄的小巷中,霓虹灯闪烁。艾斯琳格伪装成她的黑客化身 “Vixen”,蹲在控制面板旁。她的手指在腕戴界面飞舞,访问着禁用代码。难得有闲情散步的阿德里安·托雷斯在小巷入口处停下,被暗影中神秘的科技闪光吸引。
...
继续点击"Generate Character",SkyReels 自动生成了三个角色:
继续点击"Generate Storyboard",生成分镜脚本,这个时间稍长,大概用了5分钟左右:
可以逐个点击编辑,没问题的话可以点击"To Video"单独生成视频,或者直接点击"One-Click Video",将这个场景中的所有分镜脚本转换为视频,这个时间会较长。我测试了一下第3个分镜头的视频生成,配音也有了,很贴心。
如果不想用系统随机提供的故事剧本,也可以自己生成,我直接用中文测试了一下,也会帮我生成英文的小说剧本和角色,很方便。
总之,传统 AI 视频工具往往只能生成简短片段,动作生硬不连贯,且难以理解专业指令。相比之下,SkyReels V2 和 A2 无疑是视频创作领域的重大突破,堪称 AI 短剧创作领域里的 “好莱坞生产线”。
SkyReels V2 拥有无限时长的连续生成能力,彻底打破了时间限制,为创作者提供了广阔的叙事空间。无论是长篇故事还是复杂情节,都能一镜到底,流畅呈现。其动作流畅性更是达到了物理级真实,每一个转身、每一次奔跑都自然流畅,仿佛真人实拍,完全避免了传统 AI 视频中常见的卡顿和僵硬。此外,它还具备极高的智能理解能力,能够精准解析专业指令,无论是复杂的运镜技巧还是一镜到底等高阶拍摄手法,都能一一实现,为创作者提供了前所未有的精准控制。
而 SkyReels A2 则专注于多元素可控视频生成,能够将多个视觉元素精确组合成连贯自然的视频。它能精准理解并执行导演术语,从人物表情控制到特殊运镜技巧,构建出好莱坞级别的叙事逻辑和视觉效果。无论是人物微表情的细腻捕捉,还是光影细节的精致渲染,都能满足创作者对高品质视频的追求。
两者都代表了目前开源模型中的顶尖水平,为视频创作带来了革命性的变化,让创作者能够以极低的成本实现高质量的创意构想。