Wan2.7-Video - 阿里通义推出的 AI 视频创作模型 - AiBoss

Wan2.7-Video是什么

Wan2.7-Video是阿里通义实验室推出的AI视频创作大模型，支持文本、图像、视频、音频全模态输入。模型突破传统生成限制，实现”像修图一样修视频”的局部编辑、台词动作调整、运镜复刻、剧情续写等全流程创作。Wan2.7-Video支持5个主体角色控制及多宫格故事板，以”戏核”驱动专业分镜、40+种表情及电影级运镜，大幅降低专业视频创作门槛。

Wan2.7-Video的主要功能

局部精准编辑：用户可通过指令对视频画面进行增删元素、替换物体或修改属性等局部调整，且编辑后的光影与材质能与原视频自然融合。
环境风格变换：在保持人物动作不变的前提下，系统支持一键切换背景季节或将画面转换为羊毛毡、赛博朋克等多样化的艺术风格。
剧情拍摄修改：无需推翻重来，用户仅通过指令可调整角色台词并匹配口型情绪、修改行为动作，或变更机位视角与镜头类型。
剧情续写控制：通过首尾帧结合续写功能，模型在保留视频动态自然延续的同时，精准把控画面结构，实现剧情的无缝衔接与延展。
创意快速复刻：系统支持保留原视频的动作序列、镜头运动或风格特效，将其应用到全新场景中，实现动态创意的一键快速复用。
多主体角色控制：支持上传最多5个主体的图像、视频和音频参考，精准锁定角色外貌与专属音色，确保多镜头间特征高度一致。
故事板分镜控制：通过多宫格参考图，用户可精准掌控故事走向、机位构图和角色设定，实现故事板级别的分镜精准执行。
智能剧本生成：基于对专业剧本的深度学习，模型能根据用户的一句话创意自动生成符合戏剧逻辑的起承转合与专业分镜脚本。
电影级风格控制：以戏核为驱动直接生成对应的光影、摄影与色彩参数，支持上千种电影级风格的自由组合与多镜头一致性保持。
专业运镜执行：系统能精准执行希区柯克变焦、上升揭示等复杂的复合运镜技巧。
细腻表情声音：支持演绎超过40种细分表情，生成的台词准确且声音生动自然，通过音画同步技术实现富有质感的专业表演。

如何使用Wan2.7-Video

阿里云百炼：访问阿里云百炼进入模型广场，选择 Wan 系列模型可调用 API 或在网页端体验。
万相官网：访问通义万相官网提供可视化操作界面，支持直接上传素材进行创作。
使用方式：支持文本、图像、视频、音频全模态输入，通过自然语言指令控制画面结构、剧情走向、局部细节和时序变化，实现生成、编辑、复刻、续写等全流程创作。

Wan2.7-Video的关键信息和使用要求

开发团队：阿里通义实验室
产品定位：覆盖生成、编辑、复刻、续写、重塑全流程的 AI 视频创作套件
输入模态：支持文本、图像、视频、音频全模态输入
主体控制：最多支持 5 个主体，可锁定外貌特征与专属音色，保持多镜头一致性
核心能力：局部精准编辑、剧情/台词/机位修改、动作运镜复刻、剧情续写、故事板分镜控制
表演能力：支持 40+ 种细分表情，台词生成准确，声音自然且音画同步
运镜支持：数十种基础运镜（推、拉、摇、移等）及复合运镜（希区柯克变焦、上升揭示等电影级技巧）
访问渠道：阿里云百炼或万相官网
操作方式：自然语言指令控制，无需编程基础

Wan2.7-Video的核心优势

全模态输入融合：支持文本、图像、视频、音频任意组合输入，实现画面结构、剧情走向、局部细节、时序变化的全方位控制。
全流程创作覆盖：从视频生成到局部编辑、创意复刻、剧情续写、角色重塑，提供贯穿创作全链路的完整工具集，无需多平台切换。
精准局部编辑：突破传统重生成模式，支持指令级增删元素、替换物体、修改属性，编辑区域光影材质与原视频自然融合，实现像修图一样修视频。
拍摄剧情可控：无需推翻重来可通过指令调整角色台词（自动匹配口型与音色）、修改行为动作、变更机位视角与镜头类型，实现灵活的二次创作。
多主体一致性：最多支持 5 个主体的外貌与音色锁定，确保同一角色在多镜头间特征高度一致，每个角色拥有专属声音表现。

Wan2.7-Video的同类竞品对比

对比维度	Wan2.7-Video	Runway Gen-4	快手 Kling 2.6
开发方	阿里通义实验室	Runway（美国）	快手大模型团队
开源性	Apache 2.0 开源	闭源订阅制	闭源（国内版/国际版）
视频时长	最长 15 秒	最长 16 秒（Gen-3）	最长 3 分钟（可延长）
核心优势	全流程可控创作（编辑/复刻/续写）	专业工具链与精细运动控制	动作控制与超长视频生成
角色一致性	最多 5 主体锁定，多镜头外貌+音色一致	角色一致性功能，支持多镜头	角色特征保持较好
动作控制	支持动作参考复刻，40+种表情	Motion Brush 运动笔刷，精准控制运动轨迹	最强，3-30秒视频精准复刻舞蹈/武术
视频编辑	最强，支持局部增删改、台词修改	Magic Tools（绿幕、修复、重绘）	基础编辑功能
生成成本	最低（Fast版约 $0.01-0.02/秒）	高（约 $0.25-0.50/秒，订阅 $12-28/月）	中等（Pro约 $0.48-0.95/秒）
文本生成	支持生成可读文字	支持	支持文字生成
分镜控制	多宫格故事板，戏核驱动分镜	Director Mode 导演模式	有限分镜控制
适用场景	专业影视预演、多角色剧情、广告迭代	好莱坞级广告、时尚短片、专业影视后期	短视频动作复刻、长视频生成

Wan2.7-Video的应用场景

影视内容创作：独立电影、短片、动画的低成本制作，通过故事板分镜快速将剧本可视化，或用于正式拍摄前的动态预演与镜头测试。
短视频与社交媒体：创作者快速生成剧情类、变装类、特效类短视频，支持热门运镜复刻与多角色剧情演绎，适配抖音、快手、Instagram 等平台内容需求。
广告与电商营销：产品展示视频的快速生成与迭代，支持局部编辑替换商品元素、调整拍摄机位，以及虚拟模特多角度展示与口播配音。
教育培训领域：制作教学演示视频、历史场景还原、实验过程可视化，通过剧情续写功能构建连贯的知识讲解序列。
音乐与娱乐：MV 制作中实现特定风格化视觉（如羊毛毡、赛博朋克）、舞蹈动作复刻与运镜参考，以及虚拟歌手多镜头一致性表演。

Wan2.7-Video是什么

Wan2.7-Video的主要功能

局部精准编辑：用户可通过指令对视频画面进行增删元素、替换物体或修改属性等局部调整，且编辑后的光影与材质能与原视频自然融合。

环境风格变换：在保持人物动作不变的前提下，系统支持一键切换背景季节或将画面转换为羊毛毡、赛博朋克等多样化的艺术风格。

剧情拍摄修改：无需推翻重来，用户仅通过指令可调整角色台词并匹配口型情绪、修改行为动作，或变更机位视角与镜头类型。

剧情续写控制：通过首尾帧结合续写功能，模型在保留视频动态自然延续的同时，精准把控画面结构，实现剧情的无缝衔接与延展。

创意快速复刻：系统支持保留原视频的动作序列、镜头运动或风格特效，将其应用到全新场景中，实现动态创意的一键快速复用。

多主体角色控制：支持上传最多5个主体的图像、视频和音频参考，精准锁定角色外貌与专属音色，确保多镜头间特征高度一致。

故事板分镜控制：通过多宫格参考图，用户可精准掌控故事走向、机位构图和角色设定，实现故事板级别的分镜精准执行。

智能剧本生成：基于对专业剧本的深度学习，模型能根据用户的一句话创意自动生成符合戏剧逻辑的起承转合与专业分镜脚本。

电影级风格控制：以戏核为驱动直接生成对应的光影、摄影与色彩参数，支持上千种电影级风格的自由组合与多镜头一致性保持。

专业运镜执行：系统能精准执行希区柯克变焦、上升揭示等复杂的复合运镜技巧。

细腻表情声音：支持演绎超过40种细分表情，生成的台词准确且声音生动自然，通过音画同步技术实现富有质感的专业表演。

如何使用Wan2.7-Video

阿里云百炼：访问阿里云百炼进入模型广场，选择 Wan 系列模型可调用 API 或在网页端体验。

万相官网：访问通义万相官网提供可视化操作界面，支持直接上传素材进行创作。

使用方式：支持文本、图像、视频、音频全模态输入，通过自然语言指令控制画面结构、剧情走向、局部细节和时序变化，实现生成、编辑、复刻、续写等全流程创作。

Wan2.7-Video的关键信息和使用要求

开发团队：阿里通义实验室

产品定位：覆盖生成、编辑、复刻、续写、重塑全流程的 AI 视频创作套件

输入模态：支持文本、图像、视频、音频全模态输入

主体控制：最多支持 5 个主体，可锁定外貌特征与专属音色，保持多镜头一致性

核心能力：局部精准编辑、剧情/台词/机位修改、动作运镜复刻、剧情续写、故事板分镜控制

表演能力：支持 40+ 种细分表情，台词生成准确，声音自然且音画同步

运镜支持：数十种基础运镜（推、拉、摇、移等）及复合运镜（希区柯克变焦、上升揭示等电影级技巧）

访问渠道：阿里云百炼或万相官网

操作方式：自然语言指令控制，无需编程基础

Wan2.7-Video的核心优势

全模态输入融合：支持文本、图像、视频、音频任意组合输入，实现画面结构、剧情走向、局部细节、时序变化的全方位控制。

全流程创作覆盖：从视频生成到局部编辑、创意复刻、剧情续写、角色重塑，提供贯穿创作全链路的完整工具集，无需多平台切换。

精准局部编辑：突破传统重生成模式，支持指令级增删元素、替换物体、修改属性，编辑区域光影材质与原视频自然融合，实现像修图一样修视频。

拍摄剧情可控：无需推翻重来可通过指令调整角色台词（自动匹配口型与音色）、修改行为动作、变更机位视角与镜头类型，实现灵活的二次创作。

多主体一致性：最多支持 5 个主体的外貌与音色锁定，确保同一角色在多镜头间特征高度一致，每个角色拥有专属声音表现。

Wan2.7-Video的同类竞品对比

对比维度

Wan2.7-Video

Runway Gen-4

快手 Kling 2.6

开发方

阿里通义实验室

Runway（美国）

快手大模型团队

开源性

Apache 2.0 开源

闭源订阅制

闭源（国内版/国际版）

视频时长

最长 15 秒

最长 16 秒（Gen-3）

最长 3 分钟（可延长）

核心优势

全流程可控创作（编辑/复刻/续写）

专业工具链与精细运动控制

动作控制与超长视频生成

角色一致性

最多 5 主体锁定，多镜头外貌+音色一致

角色一致性功能，支持多镜头

角色特征保持较好

动作控制

支持动作参考复刻，40+种表情

Motion Brush 运动笔刷，精准控制运动轨迹

最强，3-30秒视频精准复刻舞蹈/武术

视频编辑

最强，支持局部增删改、台词修改

Magic Tools（绿幕、修复、重绘）

基础编辑功能

生成成本

最低（Fast版约 $0.01-0.02/秒）

高（约 $0.25-0.50/秒，订阅 $12-28/月）

中等（Pro约 $0.48-0.95/秒）

文本生成

支持生成可读文字

支持

支持文字生成

分镜控制

多宫格故事板，戏核驱动分镜

Director Mode 导演模式

有限分镜控制

适用场景

专业影视预演、多角色剧情、广告迭代

好莱坞级广告、时尚短片、专业影视后期

短视频动作复刻、长视频生成

Wan2.7-Video的应用场景

影视内容创作：独立电影、短片、动画的低成本制作，通过故事板分镜快速将剧本可视化，或用于正式拍摄前的动态预演与镜头测试。

短视频与社交媒体：创作者快速生成剧情类、变装类、特效类短视频，支持热门运镜复刻与多角色剧情演绎，适配抖音、快手、Instagram 等平台内容需求。

广告与电商营销：产品展示视频的快速生成与迭代，支持局部编辑替换商品元素、调整拍摄机位，以及虚拟模特多角度展示与口播配音。

教育培训领域：制作教学演示视频、历史场景还原、实验过程可视化，通过剧情续写功能构建连贯的知识讲解序列。

音乐与娱乐：MV 制作中实现特定风格化视觉（如羊毛毡、赛博朋克）、舞蹈动作复刻与运镜参考，以及虚拟歌手多镜头一致性表演。

全部分类

Wan2.7-Video是什么

Wan2.7-Video的主要功能

如何使用Wan2.7-Video

Wan2.7-Video的关键信息和使用要求

Wan2.7-Video的核心优势

Wan2.7-Video的同类竞品对比

Wan2.7-Video的应用场景

Wan2.7-Video是什么

Wan2.7-Video的主要功能

如何使用Wan2.7-Video

Wan2.7-Video的关键信息和使用要求

Wan2.7-Video的核心优势

Wan2.7-Video的同类竞品对比

Wan2.7-Video的应用场景