刚,阿里开源最强视频年夜模子!机能干翻Sora,

智货色作者|程茜编纂|心缘智货色2月26日报道,昨夜,阿里云视觉天生基座模子万相2.1(Wan)发布开源!万相2.1共有两个参数范围,140亿参数模子实用于对天生后果请求更高的专业人士,13亿参数模子天生速率较快且能兼容全部花费级GPU,两个模子的全体推理代码跟权重已全体开源。

综合来看,万相2.1的重要上风会合于以下五点: SOTA机能:万相2.1在多个基准测试中优于现有的开源模子跟贸易处理计划,140亿参数专业版万相模子在威望评测集VBench中,以总分86.22% 年夜幅超出Sora、Luma、Pika等海内外模子,居于榜首。

开展全文 支撑花费级GPU:13亿参数模子仅需8.2GB显存就能天生480P视频, 可兼容多少乎全部花费级GPU,约4分钟内(未应用量化等优化技巧)在RTX 4090上天生5秒的480P视频。 多项义务:万相2.1同时支撑 文生视频、图生视频、视频编纂、文生图跟视频生音频。 视觉文本天生:万相2.1是 首个可能天生中英文文本的视频模子,无需外部插件就能天生笔墨。

强盛的视频VAE:Wan-VAE供给出色的效力跟机能,可对恣意长度的1080P视频停止编码跟解码,同时保存时光信息。万相系列模子的研发团队基于活动品质、视觉品质、作风跟多目的等14个重要维度跟26个子维度停止了模子机能评价,该模子实现5项第一,万相系列模子可能稳固展示种种庞杂的人物肢体活动,如扭转、腾跃、回身、翻腾等;还能复原碰撞、反弹、切割等庞杂实在物理场景。官方Demo中“熊猫用滑板炫技”的视频,展现了一只熊猫持续实现多个高难度举措:

阿里云通义试验室的研讨职员昨夜23点直播先容了万相2.1的模子及技巧细节。

别的,阿里通义官方文章还提到,万相2.1的开源,标记着阿里云实现了全模态、全尺寸的开源。现在,万相2.1支撑拜访通义官网在线休会或许在Github、HuggingFace、魔搭社区下载停止当地安排休会。通义官网休会地点:https://tongyi.aliyun.com/wanxiang/Github: https://github.com/Wan-Video/Wan2.1HuggingFace:https://huggingface.co/spaces/Wan-AI/Wan2.1魔搭社区:https://modelscope.cn/studios/Wan-AI/Wan-2.1一、天生才能全方位开挂,笔墨、殊效、庞杂活动都外行在天生才能方面,万相2.1能够复原庞杂活动表示、遵守物理法则、影院级别画质、具有笔墨天生跟视觉殊效制造才能。万相2.1支撑天生走路、用饭等基础的一样平常活动,还能复原庞杂的扭转、腾跃、回身舞蹈以及击剑、体操等体育活动类的举措。