开源视频理解，视频编辑，视频变清晰系列，开源视频项目系列

2025-05-01 16:46:48 AI张禹科技

视频理解Vidi，字节跳动推出的视频理解和编辑的大型多模态模型VideoLLaMA3，阿里巴巴开源的多模态基础模型，具备

视频理解

Vidi，字节跳动推出的视频理解和编辑的大型多模态模型

VideoLLaMA3，阿里巴巴开源的多模态基础模型，具备前沿图像和视频理解能力

Qwen2-VL，基于 Qwen2 打造，参数有72B、7B、2B三种，能理解超20分钟视频，媲美GPT-4o

VideoMind，用于长视频推理的 Chain-of-LoRA 代理

视频编辑

VACE，阿里开源的视频创建和编辑工具，支持参考视频生成、视频到视频编辑和蒙版视频到视频编辑

视频变清晰

Ev-DeblurVSR，可以提升视频清晰度，也可以消除视频模糊

由于平台限制，无法发布链接，请移步沃图社查看~

阅读：0 点赞：0

玩酷网