视频理解
Vidi,字节跳动推出的视频理解和编辑的大型多模态模型
VideoLLaMA3,阿里巴巴开源的多模态基础模型,具备前沿图像和视频理解能力
Qwen2-VL,基于 Qwen2 打造,参数有72B、7B、2B三种,能理解超20分钟视频,媲美GPT-4o
VideoMind,用于长视频推理的 Chain-of-LoRA 代理
视频编辑
VACE,阿里开源的视频创建和编辑工具,支持参考视频生成、视频到视频编辑和蒙版视频到视频编辑
视频变清晰
Ev-DeblurVSR,可以提升视频清晰度,也可以消除视频模糊
由于平台限制,无法发布链接,请移步沃图社查看~