人形机器人的“三眼视界”

人形机器人产业通 2024-12-12 21:21:02

一、人形机器人与 3 目摄像的奇妙融合

人形机器人为何需要 3 目摄像?

人形机器人作为一种高度智能化的设备,需要准确感知周围环境以实现各种复杂的任务。3 目摄像为人形机器人提供了多视角的视觉信息,使其能够更全面地了解周围环境。相比传统的单目或双目摄像,3 目摄像可以实现重构目标场景的三维信息,为机器人的运动规划、避障算法等提供更精确的数据支持。例如,特斯拉人形机器人仅使用 3 个摄像头(中间鱼眼摄像头、左右各一个视觉摄像头),直接嫁接 FSD 成熟的纯视觉方案,再辅之以力力矩声学触觉温度等传感器,能够更准确地感知环境,提高决策和执行的精度。

3 目摄像为人形机器人带来了哪些新的可能?

首先,3 目摄像提升了人形机器人的环境综合感知能力。通过多目立体视觉,人形机器人可以获取更丰富的环境信息,包括物体的位置、形状、大小等,从而更好地进行路径规划、轨迹优化和避障。其次,3 目摄像有助于人形机器人实现更精准的交互与操作执行。例如,奥比中光的 3D 视觉传感器可以对工作环境进行 3D 重建以及对环境中的物体进行识别,让机器人具备场景识别与理解的能力,同时帮助灵巧手在操作过程中精准地规划路线、与物体进行精准交互(如抓取)等。最后,3 目摄像为人形机器人在新场景的应用打开了大门。随着视觉要求的提高和机器人等新场景的不断涌现,国内 3D 视觉市场规模正逐步提升,为人形机器人的发展带来了更多机遇。

二、3 目摄像的原理及技术结构

(一)3 目摄像原理

三目摄像的原理主要是通过激光折射及算法计算物体位置和深度信息,从而复原三维空间。具体来说,可从发射极向对象发射光脉冲,接收器则可通过计算光脉冲从发射器到对象、再返回到接收器的运行时间来确定被测量对象的距离。

(二)技术结构

3D 机器视觉技术分为 3D 重构技术和 3D 数据分析算法,前者获取 3D 信息、重构 3D 场景,后者对信息进行理解。

目前,3D 重构的常用技术类型有被动 3D 视觉技术、激光 3D 扫描技术、结构光 3D 技术、TOF 相机技术等,获得点云、体素等表征数据后通过算法实现识别等功能。

被动 3D 视觉技术分为单目 3D、双目 3D 和多目 3D,即分别使用一个、两个和两个以上相机组成立体视觉系统。主动 3D 视觉技术包括激光 3D 扫描技术、结构光 3D 技术、TOF 相机技术等,通过相位偏移等间接方式或者光飞行时间直接获取深度信息。

3D 重构常用技术类型有多种,具体如下:

被动 3D 视觉技术:先识别目标,根据目标在图中的大小或者被动光判断距离和深度信息。

激光 3D 扫描技术:利用一条准直光束通过一维测距扫描整个目标表面实现 3D 测量,适合远距离扫描,测量精度较低,一般在毫米量级。

结构光 3D 技术:通过投影特定图案并分析其在物体表面的变形来获取深度信息,适用于近距离、室内环境,精度高,但受光照影响较大。

TOF 相机技术:每个像素利用光飞行的时间差来获取物体的深度,可用于大视野、远距离、低精度、低成本的 3D 图像采集,检测速度快、视野范围较大、工作距离远、价格便宜,但精度低,易受环境光的干扰。

三、3 目摄像的技术发展现状

(一)消费级与工业级视觉产品

工业级机器视觉对技术、精度、稳定性等要求高,整体成本较高;而消费级视觉方案精度要求相对低,更注重成本控制。目前,人形机器人正逐步进入规模量产阶段,对视觉方案的需求主要聚焦在产能供应和成本控制两方面。在这个阶段,消费级 3D 视觉产品有望成为需求主流。

以奥比中光为例,其整体产品对 B 端的平均售价在 100 - 1000 元,C 端零售价在 1000 - 2000 元,主要产品系列为 TOF 方案,以及单目 / 双目 + 结构光的组合方案。工业级机器视觉由于各厂商内部情况和应用场景不同,定制化程度更高。工业中的机器视觉单元主要由工业相机、图像采集卡、图像处理器构成。以埃科光电披露的数据作为参考,2D 工业线扫相机单价约 6000 元,2D 工业面扫相机的单价约 3.6 万元。工业相机主要由光源、镜头、图像传感器组成,图像采集卡承担着连接工业相机与图像处理器的功能。同样根据埃科光电的采购数据,图像传感器单价约 3000 元,图像处理芯片的价格约 500 元,而搭配使用的图像采集卡价格约 3000 元。

人形机器人规模量产阶段,消费级 3D 视觉产品有望成为需求主流,主要原因在于消费级视觉方案更能满足人形机器人对成本控制的需求,同时也能提供一定精度的视觉感知能力。随着未来人形机器人应用场景的复杂化及多元化,不排除需求工业级机器视觉产品的可能性。

(二)市场规模及增长预测

我国机器视觉市场现阶段正处于快速增长阶段。中商产业研究院发布的《2024 - 2029 年中国机器视觉行业市场前景预测及未来发展趋势研究报告》显示,2023 年中国机器视觉市场规模达到 185.12 亿元,同比增长 8.49%。中商产业研究院分析师预测,2024 年中国机器视觉市场规模将增长至 207.17 亿元。智研咨询专家团队倾力打造的《2024 - 2030 年中国机器视觉行业市场竞争策略及未来发展潜力报告》指出,2023 年,我国机器视觉市场规模为 163.6 亿元,同比增长 16.57%。

全球 3D 视觉感知市场也在快速增长,将从 2022 年的 82 亿美元增长至 2028 年的 172 亿美元。3D 视觉感知行业市场崛起,市场规模预计在 2025 年达到 150 亿美元。随着 2D 成像逐步向 3D 视觉感知升级,3D 视觉感知市场处于规模快速增长的爆发前期。

我国机器视觉市场规模的增长,一方面得益于国内制造业的持续升级,电子产业、新能源锂电、光伏等领域对机器视觉的需求不断增长;另一方面,在 AI、自动驾驶、人脸识别等新兴技术兴起的带动下,我国机器视觉市场规模将继续保持较高的增速。全球 3D 视觉感知市场的增长,则主要受益于消费电子、汽车、AIoT 等行业对 3D 视觉感知技术的需求不断增加。随着人形机器人等新兴应用领域的不断拓展,3D 视觉感知市场的增长潜力巨大。

四、3 目摄像的应用场景

(一)广泛的下游应用领域

3 目摄像的应用领域十分广泛,其中 3D 视觉技术在消费电子、生物识别、AIoT、三维测量、AR/VR、机器人等领域都有着重要的应用。例如,苹果公司的 Apple Vision Pro MR 头显设备就采用了 3D 深度相机技术,展现了 3D 视觉技术在高端消费电子领域的应用。此外,3 目摄像技术在机器人领域也有着巨大的潜力,为人形机器人提供了精准的环境感知能力,使其能够更好地完成各种复杂任务。

(二)具体案例分析

奥比中光

奥比中光的 3D 拍摄方案已开始在海外商业化应用,为慢时尚品牌拍摄 3D 空间视频造型册。这一应用展示了 3 目摄像技术在时尚领域的创新应用,通过 3D 视觉技术为品牌提供了全新的展示方式。

奥比中光围绕各类型机器人推出了丰富且全面的机器人视觉感知产品方案,可提供单目 / 双目结构光、激光雷达、iToF 等全技术路线 3D 视觉传感器。其 3D 视觉感知技术及 3D 视觉传感器可以满足人形机器人的环境感知需求,为人形机器人的发展提供了有力的技术支持。

迈尔微视

迈尔微视总经理郑卫军谈 3D 视觉赋能人形机器人。威宝人形机器人集成了迈尔微视的 T 系列、S 系列和 H 系列传感器,实现了从路径导航、智能避障到精准抓取的全面支持。

T 系列视觉 SLAM 方案为路径规划提供精准支持,能够实时构建环境地图,并支持最远 30 米的感知距离。

S 系列智能避障方案保障安全协作,支持语义识别算法,让机器人能够判断障碍物类别并做出智能决策,还集成了 I/O 通讯功能。

H 系列精准抓取方案提升物料处理能力,支持亚毫米级 3D 定位,确保每次抓取都精准无误。

迈尔微视正在研发的 20 米 dToF 避障方案,将机器人感知范围提升至 20 米,代表着迈尔微视可以提供更多的室外机器人解决方案。

五、3 目摄像的优势

(一)精准识别与追踪

2D 平面视觉只能获取二维信息,无法准确识别物体的深度和三维形状。而 3 目摄像采用 3D 视觉感知技术,能够采集三维坐标信息,实现精准识别与追踪。例如,在人形机器人的应用中,3 目摄像可以准确识别物体的位置、形状和大小,为人形机器人的运动规划和操作执行提供精确的数据支持。

(二)不同方案的优势对比

双目立体视觉:精度较低,但在室外机器人等范畴有应用。双目立体视觉利用两个摄像头模仿人眼,通过视差原理计算深度信息。虽然精度相对较低,但在一些对精度要求不高的室外环境中,如大型仓库、车间等,双目立体视觉可以通过实时构建环境地图,为机器人提供路径规划和动态避障的支持。

结构光:近距离测量分辨率和精度高。结构光通过投影特定图案并分析其在物体表面的变形来获取深度信息,适用于近距离、室内环境。在人形机器人的物体识别与抓取任务中,结构光可以提供高精度的 3D 定位和尺寸测量,确保机器人能够精准地抓取目标物体。

iToF:在特定距离范围测量精度高、分辨率尚可。iToF 通过测量相位偏移间接测量光的飞行时间,在特定距离范围内具有较高的测量精度和分辨率。在人形机器人的导航和避障任务中,iToF 可以搭配 SLAM 算法实现实时路径规划,为机器人提供高效的导航服务。

dToF:远距离测量精度高。dToF 直接测量飞行时间,具有远距离测量精度高的优势。在人形机器人的室外应用场景中,dToF 可以为机器人提供更远距离的感知能力,确保机器人在大型仓储、开放式工厂以及室外场景中的应用更加自如。例如,迈尔微视正在研发的 20 米 dToF 避障方案,将机器人感知范围提升至 20 米,为室外机器人解决方案提供了更多可能性。

六、未来展望

人形机器人与 3 目摄像的结合将为未来带来更多智能化的可能,随着技术的不断发展,其应用场景将更加广泛和复杂。

首先,在技术发展方面,3 目摄像技术将不断升级和优化。例如,随着光学元件技术的进步,VCSEL 红外光发射器的性能将不断提升,为 3 目摄像提供更稳定、高效的光源。同时,DOE、Diffuser、WLO 光学透镜和红外窄带滤光片等光学元件的制作工艺也将不断改进,提高 3 目摄像的精度和分辨率。此外,随着算法的不断优化,3 目摄像对环境的感知和理解能力将进一步增强,为人形机器人提供更准确的决策依据。

其次,在应用场景方面,人形机器人与 3 目摄像的结合将拓展到更多领域。除了目前已经广泛应用的消费电子、生物识别、AIoT、三维测量、AR/VR、机器人等领域,未来还可能在医疗、教育、娱乐等领域发挥重要作用。例如,在医疗领域,人形机器人可以配备 3 目摄像,为医生提供更准确的手术辅助;在教育领域,人形机器人可以通过 3 目摄像与学生进行更生动的互动教学;在娱乐领域,人形机器人可以利用 3 目摄像为用户提供更丰富的虚拟现实体验。

最后,在产业发展方面,人形机器人与 3 目摄像的结合将推动整个产业链的协同发展。随着市场需求的不断增长,越来越多的企业将投入到人形机器人和 3 目摄像的研发和生产中,促进技术创新和成本降低。同时,政府也将加大对人形机器人产业的支持力度,推动相关政策的制定和实施,为人形机器人与 3 目摄像的发展创造良好的政策环境。

0 阅读:4

人形机器人产业通

简介:和行业同人共同学习人形机器人知识