多模态大模型 Qwen2-VL发布了。
地址:github.com/QwenLM/Qwen2-VL
有Qwen2-VL-72B、Qwen2-VL-2B 、 Qwen2-VL-7B 三个版本,后两个开源。可以理解时长超过 20 分钟的视频。同时在文档理解方面表现出显著的优势,超过 GPT-4o 和 Claude 3.5-Sonnet 等模型。
多模态大模型 Qwen2-VL发布了。
地址:github.com/QwenLM/Qwen2-VL
有Qwen2-VL-72B、Qwen2-VL-2B 、 Qwen2-VL-7B 三个版本,后两个开源。可以理解时长超过 20 分钟的视频。同时在文档理解方面表现出显著的优势,超过 GPT-4o 和 Claude 3.5-Sonnet 等模型。