随着人工智能行业快速发展,AI技术可谓日新月异,全球科技企业也都在加大对人工智能行业的投入,促进AI技术的快速突破,国内AI企业相关技术也在不断创新突破。
消息面上,字节跳动旗下的豆包大模型团队发布了视频生成实验模型“VideoWorld”,可仅靠视觉认知世界。该模型是豆包大模型团队与北京交通大学、中国科学技术大学联合提出。
这个模型最大亮点是无需依赖语言模型,仅靠视觉信息就能让机器掌握推理、规划和决策等复杂能力,是业界首个发布的,并且该模型也采用了开源策略。
长期以来,主流的多模态模型,像Sora、DALL-E和Midjourney等,在进行模型学习时,大多数是依赖语言描述或者数据标签,但是VideoWorld却另辟蹊径,直接通过视觉信号进行学习和推理。
举个简单例子,比如在日常生活中,我们想要教别人折纸或者打领结,直接用语言描述往往很难讲清楚每一个步骤,但是如果直接给一段视频,别人就能一目了然。VideoWorld就是这种可以直接看视频来学习推理,不需要语言描述,在处理一些语言难以表述清楚的任务时,优势就比较明显。

豆包VideoWorld的发布,对于AI视觉领域无疑是一次重大创新和突破,对于视觉技术领域的ISP(图像信号出来)技术和相关芯片硬件公司都有望迎来新的发展机遇。
AI视觉概念股梳理1、ISP技术相关
ISP技术即图像信号处理技术,主要用于处理图像传感器捕获的原始数据,将其转化为高质量的、适合显示或存储的图像数据,在AI视觉领域起着至关重要的作用。
相关概念股:千方科技、高德红外、同为股份、全志科技、中科创达、会畅通讯、富瀚微、国科微、维海德、星宸科技、睿创微纳。
同为股份:作为安防视频监控领域的重要参与者,在AI视觉技术的应用上独树一帜,尤其在AI大模型的研发和应用上取得了显著成果。公司拥有完整的AI算法研究团队,专注于研究AI大模型在安防领域的应用,其多模态AI大模型融合率图像、语言和文本等多样化信息。公司关于AI ISP技术的产品也已经有成熟产品线投放市场。
全志科技:在AI视觉领域以其独特的V系列解决方案脱颖而出,展现出强大的技术实力和广泛的应用潜力,通过技术创新,满足了不同行业对AI视觉的多样化需求。其V系列产品广泛应用于智能安防、智慧车载、智慧办公、智慧教育、智能家居等行业。公司第六代ISP技术取得了重大突破,而且已经应用到公司视觉产品中。

图片内容来源网络公开信息

图片内容来源网络公开信息
2、芯片硬件相关概念股
在AI视觉产业链中,芯片是不可或缺的硬件基础,为视觉处理提供强大的算力支持。
相关概念股:全志科技、富瀚微、星宸科技、瑞芯微、炬芯科技、奥比中光、安凯微。
星宸科技:作为国内领先的视觉AI芯片设计公司,在视频处理、图像识别等领域拥有深厚的技术积累。公司已经发布适用AI眼镜的SoC芯片,同时公司的AI芯片也广泛应用于视频对讲、智能车载等领域,并且占据了较高的市场份额。
富瀚微:专注于计算机大视觉领域的各类芯片设计开发,向客户提供高性能的视频编解码SoC芯片和图像信号处理芯片。公司的视频芯片作为智能互联网视频设备的“大脑”,在专业视频处理、智慧物联、智慧车行等与视频相关的各类应用场景中发挥着重要作用。
瑞芯微:作为国产芯片头部企业,在SoC芯片设计领域深耕二十余年,公司在音频、视频、显示、ISP等相关技术路线上有长期积累,公司产品广泛应用于智能家居、智能手机、AI眼镜、汽车电子、智能安防等多个领域。

图片内容来源网络公开信息
豆包发布的VideoWorld模型,是AI行业的一次技术创新与突破,其应用前景极为广阔,后续随着AI视觉学习能力提升,也有望催发更多AI应用产品落地。对于AI视觉行业来说,视觉技术和芯片硬件相关的企业,也有望获得更多的发展机会。
(本文涉及资讯、数据等内容来自网络公共信息,仅供参考,不构成投资建议)