前几天,Rokid创始人在余杭高质量经济发展大会上,用AR眼镜Rokid Glasses脱稿演讲,被各大官媒转发报道之后。
大家对AI眼镜的关注度就直线上升。
上周黑马那篇讲AI眼镜的文章里,有将近80%的朋友,或多或少都了解过这个产品。
先跟大家打个补丁,这个AI眼镜其实就是我们常说的AR眼镜,主要是通过AR现实增强技术,将现实场景和虚拟图像信息结合,再辅以AI大模型的穿戴式智能设备。
当科幻照进现实,AI眼镜出现了
在Rokid的官方介绍里,我们通过Rokid Glasses看到的场景大概是这样的:
再比如实施导航:骑车的时候,不想在车上架一部手机导航,就可以告诉你的眼镜“导航到XXXX”,经过大模型处理后,直接就可以通过眼镜,在现实场景上叠加生成直观的3D导航信息。
还有最近网上很火的实时翻译:你可以设置各种语言互译,比如你设置中英互译,你说中文,眼镜上就会显示英文,和你对话的人如果说英文,眼镜上就会显示中文。
这样你只需要把眼镜给对方戴上,他就能看到你在说些啥,如果你们俩都有Rokid Glasses,那更是可以无缝沟通。
值得注意的是,目前市面上大部分卖得很好的眼镜形态的产品,比如雷朋和Meta合作的Ray-Ban Meta,都不具备显示功能。它们主打的大多都是拍照、录制视频、听音乐啥的,还有社交媒体的交互,比如把拍摄的照片发到Ins上。
但缺失了关键的视觉显示,说实话,在体验上是有点遗憾的。而在眼镜上同步视觉信息的技术,其实叫做光波导,简单来说就是让光线以特定路径传播,最终将系统发出的图像导入人眼。其中Rokid Glasses采用了技术难度更大的衍射光波导技术,不仅使得成像更加清晰,镜片体积也能做得更轻薄,重量仅有49g,更接近普通眼镜的形态,很好解决了AR眼镜笨重的问题。(记住这个“衍射光波导技术”,下一趴要考的哈)
AR眼镜:移动智能终端的终极形态
实际上黑马发现,这两年大家对智能终端的要求,已经不再满足于手持式的设备。一个原因是因为手持式的产品,始终局限于“握持”的物理形态,并没有真正做到随身,比如虽然我们常常吐槽手机不离手,但你睡觉、工作、运动的时候,还是要放下手机。所以在很长一段时间里,穿戴式设备就是我们在特定场景中,更常使用的产品。
但有一个问题是,不管是手表,还是耳机,其实都没有真正将听觉、视觉和空间感知整合为统一的交互界面。你看手表依旧需要抬起手臂,耳机也依旧无法提供视觉信息交互。
而另一个问题是,无论是手机还是手表,指令和内容的输入都是通过按键或者触屏操作的,可是AR眼镜很显然无法更细致的进行按键或者触屏操作。
所以对于AR眼镜而言,另一个重要的模块,就是智能化识别语音指令,辅以视觉识别、简单的触控和指环类穿戴的手势操控,才能形成完整的操控链路。对于语音内容的理解,是AI大模型的强项,而智能识别场景和搜索整合信息的部分,也由AI大模型来完成,比如Rokid Glasses上搭载的通义千问大模型:其日常场景中常用的导航、播放音乐、实时翻译,其智能程度和响应速度,都随着今年AI大模型的快速迭代,在不断优化。
加上Rokid自研了YodaOS系统,使得Rokid Glasses在用户体验上更上一层楼。正如Rokid创始人提到:“AR眼镜是AI最好的载体”。眼镜是离我们视觉器官最近的设备,所有信息在收入眼底之前,首先都要经过眼镜。换句话说,如果把信息投射到在眼镜上,就可以毫无障碍地和现实场景一起进入我们的视觉系统,真正意义上实现了无感交互。
你看到什么,交互信息就显示什么,提出需求,解决方案就展现在眼前,这种如臂使指的感觉,大概是黑马能想到的,最贴近真实需求的体验。
但是,这里要说但是了,就算在眼镜形态的产品中,早些时候受限于技术,很多产品还是牺牲了一些核心功能:比如屏显功能,上一篇文章里黑马提到过,早期出现过一批将蓝牙音箱和眼镜结合的AI音频眼镜,这种产品的的核心主要在镜腿上,那里集成了整副眼镜最核心的内容——开放式蓝牙耳机。
但在镜片上,并没有集成AR技术。
就算是后来卖得很好的Ray-Ban Meta,其实也没有提供视觉方面的交互。而造成这种情况的很大一个原因在于,AR眼镜屏显的技术要求很高,特别是想做到轻便日常,非常困难。
这里黑马要简单给大家科普几个XR相关的技术:在增强现实技术上,目前市面上比较常见的有两种技术,一个是VST(Video see through),一个是OST(Optical see through)。其中VST是通过将虚拟图像叠加在真实世界中的实时视频流上,用户可以透过显示屏或眼镜等设备观看到增强现实内容,但本质上看到的只是一段视频。
苹果Vision Pro使用的就是VST技术。不过我们都知道,Vision Pro不仅笨重,佩戴需要套住整个头部,时间长了还会有明显的挤压感。这是因为VST虽然深度体验感强,但是功耗很大,同时对硬件设备要求高,体积大不说,重量也很明显,主要还是被用在娱乐、游戏、影音方面。
也就是说Vision Pro充其量就是个元宇宙版本的Xbox和PS5,想代替手机在日常使用,根本不现实。而OST则是通过光学显示模组,通过透明显示屏或眼镜等设备将虚拟图像投影到用户的视野中,使用户能够同时看到真实世界和增强现实内容。本质上,看到的还是真实世界。
比如Rokid之前推出的Rokid AR Lite就是使用的OST方案。
其特点是轻便易携带,使用场景广泛,适合翻译、办公、会议等多种场景使用,而且功耗低、硬件轻便。
而Rokid Glasses采用的衍射光波导技术,其实就是在OST技术的基础上优化出来的,更先进的光波导技术。简单来说就是利用光栅的衍射特性来设计光路,比起传统OST显示信息浮于场景,易产生“鬼影”,衍射光波导更像是在把信息“刻”在场景中;
能做到仅49g却支持4K显示,透光率达83%,更符合人类视觉本能。
很显然,轻便和应用场景广泛,是用户最核心的痛点——在手机依旧在强调轻薄的当下,只能在特定场景使用的,笨重的穿戴设备,远不如AR眼镜来得自然和高效。
规模化起势,AR眼镜爆发前夜但对于消费者来说,从技术突破到实际应用其实还有一段距离。尽管黑马对Rokid自主研发的各种技术津津乐道,但要把技术落地成为消费品,毫无疑问是一个非常大的挑战。
最直观的,如果产品在消费市场爆了,产能跟不上怎办?你订单一个月下了20万副,但工厂却只能搓出来2000副,一看交付周期要半年,这不完犊子了吗?衍射光波导、纳米压印等技术的成本摆在那里,规模化量产没起来,价格下不去,谁买?手机才几千块钱一部,眼镜却要卖几万,这不符合逻辑啊。
2月22号的时候,Rokid和蓝思科技达成了深度战略合作的事儿不知道大家关注了没有。混机圈的朋友对蓝思科技应该不算陌生,作为果链三巨头之一,蓝思在面板玻璃、摄像头玻璃等元器件上,有着很深入的技术积累和布局。除了前面提到的光波导技术,蓝思科技还有自主研发的纳米微晶玻璃技术,可以将镜片的透光率提高到95%,无限接近普通眼镜。
恰好,Rokid Glasses采用的工艺复杂的衍射光波导技术,与蓝思科技的核心技术不谋而合,据了解,蓝思科技会负责Rokid Glasses从镜架、镜片、功能模组到组装的制造全链条,加速Rokid Glasses的规模化交付。不但大幅度缩减了交付周期,还将深度提供产业配套的相关技术。
对于消费者而言,这意味着下了单不会出现“暂时缺货”的提示,价格却更加让人心动,产品力更加稳定,甚至还会有稳定的迭代……但很显然,Rokid和蓝思科技在产业链方面的整合,加速了AI眼镜在消费测的成熟和落地。
有数据显示,2025年全球AI眼镜出货量爆发式增长,预计达400万-1200万台,其中“Made in China”的力量应该不容小觑。但更值得注意的是,Rokid和蓝思科技的合作折射出的其实是:中国AI眼镜产业正以全链条自主可控的硬实力改写全球竞争格局。
不论是光波导技术,通过纳米级光栅将光线“折叠”进3mm镜片,还是通义千问等国产模型植入眼镜,实时响应速度碾压国际竞品。从上游纳米微晶玻璃材料到终端消费级产品,本土企业已经构建起全球最完整的产业链。可以说AI眼镜已然成为中国面对世界一张新的名片,而且显而易见的是,Rokid已经成为这张名片上,最先被世界记住的名字。
写在最后当苹果用Vision Pro告诉世界“未来很贵”,以Rokid为首的中国AR企业却已经用一块透明镜片,照出了智能硬件的下一个黄金十年。2025年,全球每卖出3台AR眼镜,就有1台贴着“Made in China”的标签。但比数字更震撼的是:这一次,我们不再追赶标准,AR真实世界的数字化进程,由中国眼镜定义。
撰文:柯然
编辑:小马哥