首页 > 新闻 > 正文

阿里开源全能视频大模型，单一模型支持视频生成与编辑全功能

作者：访客栏目：新闻2025-05-14 23:263399

阿里巴巴近期推出了一款开源全能视频大模型，该模型单一支持视频生成和编辑的全流程，该模型具备高度智能化和自动化特点，能够高效处理视频内容，提升视频制作效率和质量，这一创新技术的出现，有望为视频行业带来革命性的变革，促进视频内容创作的繁荣和发展。

每经杭州5月14日电（记者叶晓丹）5月14日晚，《每日经济新闻》记者获悉，阿里巴巴正式开源通义万相Wan2.1-VACE，这是业界功能最全的视频生成与编辑模型，单一模型可同时支持文生视频、图像参考视频生成、视频重绘、视频局部编辑、视频背景延展以及视频时长延展等全系列基础生成和编辑能力。本次共开源1.3B和14B两个版本，其中1.3B版本可在消费级显卡运行。

阿里开源全能视频大模型，单一模型支持视频生成与编辑全功能-图1

据阿里云方面介绍，Wan2.1-VACE基于通义万相文生视频模型研发，同时创新性提出了全新的视频条件单元（VCU），它在输入形态上统一了文生视频、参考图生视频、视频生视频，基于局部区域的视频生视频4大类视频生成和编辑任务；同时，Wan2.1-VACE还进一步解决了多模态输入的token（词元）序列化难题，将VCU输入的帧序列进行概念解耦，分开重构成可变序列和不可变序列后进行编码。

据了解，自今年2月以来，通义万相已先后开源文生视频模型、图生视频模型和首尾帧生视频模型，目前在开源社区的下载量已超330万。

封面图片来源：视觉中国-VCG211478193393

# 视频

相关推荐

Skype正式下线引发怀旧潮，探究其6.6亿用户的情感纽带

Skype正式下线，拥有6.6亿用户的视频聊天巨头告别时代舞台，这款曾经风靡全球的软件，见证了无数人的交流历程，人们怀念它，因为它曾是网络通讯的里程碑，代表着一种时代的记忆与情感的连接，它的下线引发了人们对过去交流方式的怀念，以及对那段历史...

访客
2025-05-10
5774 0 0
胖东来维权事件最新进展，抖音平台下架柴怼怼视频并限权一个月

关于胖东来维权的最新进展，抖音平台已下架“柴怼怼”的29条视频，并对其账号进行一个月的限权处理，这一行动表明平台对于维权问题的重视，同时也为用户提供更加安全、公正的购物环境，此举也提醒内容创作者要遵守平台规则，避免引发不必要的争议和纠纷。...

访客
2025-05-04
3477 0 0
快手成立可灵AI事业部，半年收入突破亿元大关

近日，快手公司正式成立可灵AI事业部，该事业部在短短半年内收入突破亿元大关，可灵AI事业部的成立标志着快手在人工智能领域的进一步拓展和深化，将助力公司更好地服务用户和推动业务发展，此举也显示出快手对于人工智能技术的重视和布局，未来可灵AI将...

访客
2025-04-30
2684 0 0
宇树科技创始人王兴兴首次公开推荐书单，视频阅读助力知识高效传递无界限

宇树科技创始人王兴兴首次分享了他的个人书单，强调视频阅读作为一种高效的知识获取方式，能够突破传统文字阅读的限制，他认为，知识不应受限于载体，视频阅读能够更好地融合视觉和听觉，提高信息吸收效率，这一观点展示了当代知识传播的新趋势。...

访客
2025-04-23
757 0 0
抖音对卤鸭店老板摆拍争议作出回应，账号禁言并限制营利权限，违规粉丝被清除

抖音针对卤鸭店老板摆拍争议事件作出回应，对涉事账号采取严厉措施，该账号已被禁言30天，同时限制其营利权限60天，并清除因违规视频而获得的粉丝，此举旨在维护平台诚信和公正，确保内容真实可靠，防止虚假宣传，此次事件提醒用户应关注内容真实性，共同...

访客
2025-04-22
6464 0 0
H.266视频技术超越H.265，渗透率超七成，视频大小减半成主流趋势

相较于H.265视频，H.266视频大小减小了一半，更加节省存储空间和网络带宽，H.266已成为头部平台的主流视频编码技术，市场渗透率超过70%，广泛应用于在线视频、流媒体等领域，其高效的压缩性能为视频传输和处理带来了极大的便利，推动了视频...

访客
2025-04-21
7385 0 0
北上成3月黄金时段电视剧收视冠军，观众规模达8.5亿户次

《北上》在三月黄金时段电视剧中稳居首位，吸引了高达8.5亿户次的观看，该剧以其引人入胜的剧情和出色的表现，赢得了广大观众的喜爱和高度认可。《北上》成三月电视剧冠军，收视户数达8.5亿，展现其强大的吸引力和影响力。...

访客
2025-04-16
3785 0 0